1,2,3기에 따라 시간의 차이가 있는지를 보고 싶어서 ANOVA 분석을 생각 하고 있습니다.
1) ANOVA 분석을 위해 boxplot에서 보이는 이상치를 다 제거 하고 정규화 과정을 거친 후 다시 정규성 검사를 해 봐야 하나요??
아니면 이 상태에서 정규화 과정 후 다시 정규성 검사를 해도 괜찮나요??
2) 1,2,3기 데이터의 수가 1만개, 2만개, 1만개 이렇게 되어 있습니다. 그건 상관 없나요??
통계분석 초보라 질문 드립니다.
Comment 1
-
cardiomoon
2021.11.16 17:25
1) 이상치를 제거하는 것이 아니라 왜 이상치가 있는지 고민하는 것이 통계의 시작입니다
2) 데이터 갯수는 상관 없습니다.