불유합을 일으키는 위험인자에 대해서 조사하고자 한다.
1)
| 뷸유합 n=40 | 유합 n=200 |
경부단축 30% 이상 | 30 | 10 |
경부 단축 30% 미만 | 10 | 190 |
2)
| 불유합 n=40 | 유합 n=200 |
남자 | 23 | 90 |
여자 | 17 | 110 |
3)
| 불유합 n=40 | 유합 n=200 |
BMI : 연속변수 |
|
|
첫번쨰 통계방법 : "각각의 변수를 따로따로 검정한다"
1),2)는 카이 제곱 검정 (유의한 차이가 있는지와 odd ratio 를 알수 있다)
3)은 t 검정 (유의하게 차이가 있는지만 알 수 있다)
-> 결과에 따라 유의한 차이가 있는 변수를 위험인자로 해석한다.
두 번째 통계방법: "모두를 한번에 검정한다."
logistic regression test 로 모든 변수를 돌려 각각변수의 odd ratio를 확인한다.
-> 통계적으로 유의한 수준의 차이가 있는 변수를 확인하여 위험인자로 해석하고
이들의 odd ratio를 위험도 정도로 해석한다.
첫번쨰와 두번쨰중 어떤 것이 맞는 통계 방법인지 모르겠습니다. 고수님들 많은 조언 부탁드립니다.
Comment 1
-
cardiomoon
2017.07.28 08:58
No. | Subject | Author | Date |
---|---|---|---|
1114 | 성향점수 맞추기 [3] | alse | 2016.05.25 |
1113 | 아래에 올렸었는데요,, 5Y overall survival 구하는 법이요. [2] | 난둥 | 2016.05.26 |
1112 | 로지스틱 회귀 분석에서.. [1] | 최00 | 2016.05.27 |
1111 | 기본표를 만드는데 file이 이상하게 읽히는 것 같습니다. | 매일이5월 | 2016.06.02 |
1110 | 파일 불러오기 에러 [2] | 매일이5월 | 2016.06.02 |
1109 | 파일 불러오기 오류 [2] | 매일이5월 | 2016.06.02 |
1108 | RPubs에 있는 ROC curve analysis by cardiomoon [2] | hawk1227 | 2016.06.02 |
1107 | R 그래프 옮기기 [2] | hawk1227 | 2016.06.03 |
1106 | 생존분석 그래프 x축 시간 [3] | alse | 2016.06.07 |
1105 | 자료업로드에러 [3] | dejavu730 | 2016.06.07 |
1104 | 학생강의 project1 | cardiomoon | 2016.06.07 |
1103 | 결측치 처리에 대한 질문입니다. [2] | 매일이5월 | 2016.06.07 |
1102 | IBM의 R 컨소시엄 가입 | Ben | 2016.06.08 |
1101 | 서버 접속이 안됩니다 [2] | kim | 2016.06.08 |
1100 | binary data 군집분석 [2] | 노가리 | 2016.06.08 |
1099 | 생존 분석시 문제 [3] | selteen | 2016.06.09 |
1098 | 생존 분석을 하는데 질문이 있어 게시판에 글을 올립니다. [1] | namuhanayeyo | 2016.06.11 |
1097 | 독립(설명)변수 비정규 분포시. logistic regression 문의입니다. [1] | 매일이5월 | 2016.06.16 |
1096 | Simple linear regression 에서 설명변수의 특성 [3] | 매일이5월 | 2016.06.16 |
1095 | Rstudio 에러 문제 [2] | 화모기 | 2016.06.16 |
어느 방법이 맞고 틀리고의 문제가 아닙니다.
첫번째 방법 즉 단변량 검정은 두 변수의 관계에 대해 알수 있습니다. 하지만 이 경우 confounding variable이 있는 경우 해석이 문제가 될 수 있습니다.
과거에 커피와 폐암의 관계에 대한 관찰연구가 많았는데 그 결과는 일관되게 커피를 많이 마시는 사람에서 폐암이 많이 발생하는 것으로 나왔습니다.
하지만 그 이유는 흡연이라는 인자가 작용했기 떄문이었습니다. 즉 커피를 많이 마시는 사람이 담배를 많이 파웠는데 담배 때문에 폐암의 위험이 증가한 것입니다.
이러한 confounding variable의 영향을 배제하기 위해 시도하는 방법이 randomized trial 이고 randomized trial 이 불가능할 경우 선택하는 방법이 다중회귀방법입니다.
두번째 방법이 다중로지스틱회귀로 다중로지스틱 회귀의 설명변수로 A,B,C등을 넣은 후 그 결과 A의 odd ratio가 1.2가 나왔다면 1.2의 해석은 B,C가 일정할때 A의 값에 따라 결과가 1.2배 달라진다로 해석할 수 있습니다.