Skip to menu

mytable에서 하는 통계법 질문

수수 2019.07.11 13:47 Views : 1673

안녕하세요.

몇년 전 교수님 책으로 R에 입문하여 현재까지 열심히 사용 중입니다.

의료보건분야 R 관련 책은 (지금은 안 찾아보아 모르겠지만) 당시에는 이 책밖에 없었던 것 같고,

입문자에게도 쉽게 잘 읽혀서 R을 사용하게 된 확실한 계기가 되었습니다.

책을 쓰시는 것 외에도 다른 많은 활동을 하고 계신 걸 근래에 알게되었네요. 질문을 드리기에 앞서 늦었지만 매우 감사드립니다.^^


논문 작성시 및 변수들을 스크리닝 목적으로 살펴볼 때에도 moonBook 패키지가 매우 유용한 것 같은데요, mytable 함수와 관련하여 궁금한 점이 있습니다.


mytable 함수를 사용하면, 변수 특징에 따라서, 자동으로 적절한 통계법을 사용하여 p값을 구해주는데요,

어떤 변수에 구체적으로 어떤 통계법을 사용하여 나온 p값인지 궁금한데, 그에 대해서는 매뉴얼을 읽어봐도 제가 잘 못 찾은 것인지 설명을 찾지 못했습니다.


제가 이번에 하고자 하는 것은 '그룹별 연속형 변수의 차이 비교' 입니다.

제가 가지고 있는 기본 통계책을 보면 그룹별 연속형 변수 비교시에 아래와 같은 순서로 판단하여 통계방법을 선택하고 적용하는 것 같습니다.

(1) 정규성 검정[만족] -> 등분산 가정 [만족] -> Student t-test

(2) 정규성 검정[만족] -> 등분산 가정 [불만족] -> Welch t-test

(3) 정규성 검정[불만족] -> Mann Whitney U test


mytable 함수를 통해 제가 가지고 있는 데이터를 돌려서 나온 p값이, 어떤 통계방법을 통해 나온 것인지 궁금해서, 

제가 별도로 계산한 p값과 비교해보았습니다. 그랬더니,

(1) bartlett.test 등분산 가정 [만족] -> Student t-test

(2) bartlett.test 등분산 가정 [불만족] -> Welch t-test

를 적용하는 것 같았습니다. 다만, 매뉴얼에서 설명하고 있는 것처럼 정규성을 만족하지 않는 변수에 대하여 비모수적 검정방법(Mann Whitney U test)을 사용하고 있는 것 같지는 않았습니다.


mytable에서 show.all=TRUE로 설정하면 ptest라는 항목으로 변수마다 'non-normal', 'normal'을 구분해주고 있는데,

여기에서 'non-normal'이라고 표시된 변수도 Mann Whitney U test가 아니라 Student t-test에서 나온 p값과 일치하였습니다.


제가 사용해본 정규성 검정 방법과 달라서 제가 잘못 판단한 것일 수 있습니다.

그렇다면 mytable함수에서 정규성 검정은 어떤 방법으로 하는지(Lilliefors? Shapiro-Wilk? 혹은 다른 방법?)도 궁금하고,

정규성 검정 결과에 따라 Student (or Welch) t-test 혹은 Mann Whitney U test를 구분해서 하고 있는지도 궁금합니다.


평상시에는 특별히 관계가 없더라도, 특히 논문에서 결과 제시할 때에 어떤 통계법을 사용했는지에 대한 설명이 필요하기 때문에 이렇게 문의를 드립니다.

더불어, 그룹별 연속형변수 차이 분석 뿐만 아니라, 범주형 등의 경우에도 어떤 경우에 통계법을 사용하고 있는지 등도 알려주시면 더욱더 잘 활용 할 수 있을 것 같습니다^^


감사합니다.!!

No. Subject Author Date
1214 안녕하십니까 교수님 PSM 결과에 대해 궁금한 것이 있어 여쭤봅니다 [2] secret 김도훈 2023.06.29
1213 교수님 지난 번 문의 드렸던 PSM 재문의 드립니다. [3] secret 긍정적인마음가짐 2023.06.27
1212 안녕하세요 ^^ odds ratio 와 관련된 문의드리고자 합니다 ^^ [2] 성열 2023.06.26
1211 mytable() 함수에서 na처리와 pvalue 계산 문의드립니다. [1] hjk34 2023.06.23
1210 교수님 안녕하세요 ^^ web-R table 작성관련 문의드립니다. [2] file mkw7654 2023.06.21
1209 Methods for continuous variables과 P value corrected for multiple comparisons 방법 궁금합니다. [1] 호호셀 2023.06.19
1208 ordinal logistic regression analysis 문의 [1] 버블 2023.06.18
1207 e-mail 변경 문의 [1] secret kimdo 2023.06.16
1206 안녕하세요 number at risk 관련 문의 드립니다 [1] secret cebukim 2023.06.13
1205 Propensity matching score 에 대해 문의드립니다. [1] saga 2023.06.08
1204 콕스비례위험모델의 적용에 관련해서 질문 드립니다. [2] secret kng1032 2023.06.07
1203 기초통계 계산 [2] secret leesav 2023.06.07
1202 정회원 후원하였습니다. [2] secret toast 2023.06.04
1201 logistic regression analysis 가 에러가 뜹니다. [1] secret Ikarus86 2023.06.02
1200 PMS caliper 에 대해 여쭤봅니다. [2] secret pjhaaa 2023.05.30
1199 ggGam에 대하여 [2] leesav 2023.05.22
1198 R 에서 PFS 의 confidence interval 을 구하고 싶을 때 어떻게 하면 될까요? [1] ddeeny 2023.05.21
1197 메타분석 관련 문의드립니다 secret 화이팅 2023.05.12
1196 교수님, 새로운 앱 개발 문의드립니다! [4] swpapa 2023.05.08
1195 교수님, 안녕하세요? 전용 앱 관련 문의드립니다! [1] swpapa 2023.05.07