안녕하세요 교수님
moonBook 패키지를 여러 연구들에서 잘 활용하고 있습니다. 감사드립니다!
mytable 함수를 사용할 때 3그룹 이상에서 ANOVA (정규분포 시) 로 분석한 결과가 출력되는 것으로 알고 있는데
직접 ANOVA로 분석한 결과와 p value가 다를 때가 있어서 문의드립니다.
예를 들어
4개 그룹에서 bmi의 차이를 mytable에서 분석하면 아래와 같이 결과가 출력되는데
____________________________________________________________________
1 2 3 4 p
(N=19) (N=96) (N=170) (N=154)
------------------------------------------------------------------------
bmi 15.71 ± 1.31 15.68 ± 1.57 15.61 ± 1.59 16.25 ± 2.17 0.010
------------------------------------------------------------------------
aov (bmi ~ factor(group), data=xx) 이렇게 분석한 경우 p value가 다르게 출력이 됩니다.
Df Sum Sq Mean Sq F value Pr(>F)
factor(group) 3 38.6 12.863 3.951 0.00846 **
Residuals 435 1416.3 3.256
group에서 factor를 제외하고 aov(bmi~group, xxx)로 실행하였을 때 p value가
mytable과 값이 동일하게 나오는데요
Df Sum Sq Mean Sq F value Pr(>F)
group 1 21.8 21.781 6.642 0.0103 *
Residuals 437 1433.1 3.279
제 생각에는 factor( )를 포함해서 돌린 것이 더 맞는 결과일 것 같은데 (df=3)
왜 이런 차이가 나는지 문의드리고자 합니다.
감사합니다 !
Comment 1
-
cardiomoon
2021.11.20 17:38
moonBook의 버젼이 어떻게 되지요? 최신버젼을 설치해보실 것을 권해드립니다. 최신버젼의 moonBook에서는 group변수를 factor로 처리합니다.
보다 좋은 방법은 질문하신 것과 같이 Group 변수가 categorical variable인 경우에는 1,2,3 등의 숫자가 아닌 문자형변수 등을 사용할 것을 권해드립니다.
감사힙니다.