안녕하세요 교수님,
웹 R을 이용한 통계분석 책을 만들어주셔서 정말 감사합니다 :)
해외에서 공부하는 석사생에게 정말 큰 도움이 되고 있습니다.
제가 아직은 초보라 정말 간단한 질문을 드리려고 하는데요,
온라인 설문조사를 이용한 실험을 통해 control group 과 Experimental Group 이 있으며 각 그룹에
2개의 nationality 에 따른 cross-cultural study를 진행했습니다.
이런 경우 t-test 를 웹에서 하는 R을 통해 돌려보았는데, 종속변수 1개 (P3)에 대하여 아래와 같은 값이 나왔습니다!!
F test to compare two variances data: P3 by nationality F = 0.48362, num df = 31, denom df = 29, p-value = 0.04968 alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: 0.2320482 0.9989593 sample estimates: ratio of variances 0.4836221 t.test(P3~nationality,data=uploaded,alternative='two.sided',var.equal=FALSE); Welch Two Sample t-test data: P3 by nationality t = 1.2917, df = 51.378, p-value = 0.2022 alternative hypothesis: true difference in means between group 1 and group 2 is not equal to 0 95 percent confidence interval: -0.2354134 1.0854134 sample estimates: mean in group 1 mean in group 2 3.625 3.200
이때 위 F test 에 따른 p-value 와 t-test 에 따른 p-value의 차이가 궁금합니다.
둘중 어떤 p value를 따라야 할까요?
위에 따르면 <0.05라서 유의미한 결과라고 할수 있을 것 같아서요!
어떤 guidance라도 정말 감사하겠습니다.
더운 여름 늘 건강하세요 교수님!
감사합니다.
Comment 3
-
내일
2022.07.25 07:47
-
민됴
2022.07.25 07:58
답변 감사드립니다! 이것 저것 시도 후 현재 t-test 로 방향을 좁힐 수 있었어요 :)
-
내일
2022.07.25 09:27
글에 내용이 추가되었군요. F test는 chi-square test에 대한 결과입니다. 이에 대한 정보는 구글링하면 많이 나오니 참고하시면 될 것 같고요.
p < 0.05는 사실 엄밀한 값은 아닙니다. (p < 0.05를 기준으로 두는 것을 지양하자는 글도 찾아보시면 많이 나올 것입니다.) 유사한 분석을 한 연구들이 p value를 어느 정도 선을 기준으로 두고 판단하는지 확인해보시는 것이 필요할 것입니다.
No. | Subject | Author | Date |
---|---|---|---|
1114 | 성향점수 맞추기 [3] | alse | 2016.05.25 |
1113 | 아래에 올렸었는데요,, 5Y overall survival 구하는 법이요. [2] | 난둥 | 2016.05.26 |
1112 | 로지스틱 회귀 분석에서.. [1] | 최00 | 2016.05.27 |
1111 | 기본표를 만드는데 file이 이상하게 읽히는 것 같습니다. | 매일이5월 | 2016.06.02 |
1110 | 파일 불러오기 에러 [2] | 매일이5월 | 2016.06.02 |
1109 | 파일 불러오기 오류 [2] | 매일이5월 | 2016.06.02 |
1108 | RPubs에 있는 ROC curve analysis by cardiomoon [2] | hawk1227 | 2016.06.02 |
1107 | R 그래프 옮기기 [2] | hawk1227 | 2016.06.03 |
1106 | 생존분석 그래프 x축 시간 [3] | alse | 2016.06.07 |
1105 | 자료업로드에러 [3] | dejavu730 | 2016.06.07 |
1104 | 학생강의 project1 | cardiomoon | 2016.06.07 |
1103 | 결측치 처리에 대한 질문입니다. [2] | 매일이5월 | 2016.06.07 |
1102 | IBM의 R 컨소시엄 가입 | Ben | 2016.06.08 |
1101 | 서버 접속이 안됩니다 [2] | kim | 2016.06.08 |
1100 | binary data 군집분석 [2] | 노가리 | 2016.06.08 |
1099 | 생존 분석시 문제 [3] | selteen | 2016.06.09 |
1098 | 생존 분석을 하는데 질문이 있어 게시판에 글을 올립니다. [1] | namuhanayeyo | 2016.06.11 |
1097 | 독립(설명)변수 비정규 분포시. logistic regression 문의입니다. [1] | 매일이5월 | 2016.06.16 |
1096 | Simple linear regression 에서 설명변수의 특성 [3] | 매일이5월 | 2016.06.16 |
1095 | Rstudio 에러 문제 [2] | 화모기 | 2016.06.16 |
저는 교수님이 아니지만 댓글을 달자면, experiment의 목적을 명확히 하여 hypothesis을 설정한 후, 그에 따른 model based 분석할 수도 있고
어떻게 hypothesis을 설정해야할지 모를 경우 exploratory data analysis를 할 수도 있습니다. 좀 고생하는 길이긴 하지만, 그래도 아무것도 안하고 계속 머릿속에서 맴도는 것보다는, 의미가 있을 수 있는 방법을 이것저것 다 시도해보면서 나오는 결과를 보면서 방향성을 잡아갈 수 있기 때문에, 실제로 많이 하는 방법입니다.
방향성이 잡히지 않을 때는, 간단한 모델부터 차근차근 다 시도해보셔도 좋습니다.