R 초보로,, 여기저기 공부하기 시작하여 많은 도움 받고 있습니다.
감사합니다.
기초적인 질문인데요..
baseline characteristics와 같은 table을 만들면서..
ct = table(B[,a],regimen)
result1 = margin.table(ct,1)
result2 = margin.table(ct,2)
result3 = prop.table(ct)
result4 = prop.table(ct,1)
result5 = prop.table(ct,2)
result6 = summary(table(B[,a],regimen))
print(ct)
print(result5)
print(result6)
이러한 함수로 범주형변수를 분석하였는데
summary에서 나온 p value와
이 홈페이지에서 만들어준 표의 p value의 값이 다른데요
방식에 차이가 있는 건가요?
Comment 4
-
cardiomoon
2016.03.10 06:12
-
난둥
2016.03.10 07:36
위의 함수를 실행시키면 결과가 아래와 같이 나옵니다.
----------------------------------------
[1] "relapse_pattern"
regimen
2 3
1 18 5
2 4 1
regimen
2 3
1 0.8181818 0.8333333
2 0.1818182 0.1666667
Number of cases in table: 28
Number of factors: 2
Test for independence of all factors:
Chisq = 0.007378, df = 1, p-value = 0.9315
Chi-squared approximation may be incorrect
--------------------------------------------------------------
여기서 도출되는 P-value와 웹에서하는 그래프에서의 차이를 알 수 있을지요?
-
cardiomoon
2016.03.10 22:05
웹-R의 서버선택에 가셔서 ttest앱을 실행하시면 raw data없이 카이제곱 검정등을 할 수 있습니다.
어쨋든 결과를 보시면 다음과 같이 나옵니다.
위의 그림에서 보는것과 같이 Pearson's chisquare 값과 Pearson's chisquare test with Yates' continuity correction값이 약간 다릅니다. 웹R에서는 기본적으로 Yates' correction을 해줍니다.
Yates' continuity correction의 의미는 다음 페이지를 참조하십시요.
https://en.wikipedia.org/wiki/Yates%27s_correction_for_continuity
-
난둥
2016.03.11 02:43
아 그렇군요.
자세한 설명 감사드립니다!!
summary 함수로는 p 값이 안 나올텐데요. 데이타를 보여주시고 구체적으로 말씀해주셔요.