x,y,z년도 40대가 각각 2373, 1859, 2521명, 50대가 각각 3065,2837,4044명이라고 가정했을때
x y z
40대 2373, 1859, 2521
50대 3065, 2837,4044
cochrane armitage test 시행할 경우 40대가 시간이 갈수록 유의하게 증가하는 트렌드를 보인다. (50대가 시간이 갈수록 유의하게 감소했다.) (p<0.05)
와 같이 해석해도 무리가 없나요?
또 궁금한 것은,
위의 예제를 백분율로 변경했을 경우
x y z
40대 43.64 39.59 38.40
50대 56.36 60.41 61.60
cochrane armitage test 시행후 p value가 다른데 n수로 트렌드분석할지 %로 트렌드분석할지는 연구자재량인지요
감사합니다.
R코드)
<N수>
test<-matrix(c(2373,1859,2521,3065,2837,4044),byrow=TRUE,nrow=2)
test
Desc(test)
CochranArmitageTest(test)
<%>
age<-matrix(c(43.64,39.59,38.40,56.36,60.41,61.6),byrow=TRUE,nrow=2)
age
Desc(age)
CochranArmitageTest(age)
Comment 1
-
cardiomoon
2018.04.02 23:25
1) 통계를 돌리기 앞서 중요한 것은 정보의 전처리입니다. 나이는 연속형 변수인데 이것을 왜 인위적인 40대와 50대의 그룹변수로 바꾸어 처리하는지요?
차라리 x년도, y년도, z년도의 나이정보를 그대로 사용하여 평균이 같은지 다른지 보는 것이 낫지 않을까요?
40대, 50대로 보면 10의 자리에서 내림을 하여 41세와 49세를 같게 취급하고 49세와 50세는 다르게 취급하는 것인데 이는 중요한 정보를 일부러 손상시키는 것입니다.
2) prop.trend.test를 시행하는 방법은 다음과 같습니다.
> test<-matrix(c(2373,1859,2521,3065,2837,4044),byrow=TRUE,nrow=2)
> prop.trend.test(test[2,],colSums(test))
Chi-squared Test for Trend in Proportions
data: test[2, ] out of colSums(test) ,
using scores: 1 2 3
X-squared = 32.97, df = 1, p-value = 9.361e-09
여기서 prop.trend.test()의 도움말을 보면 다음과 같습니다.
Test for trend in proportions
Description
Performs chi-squared test for trend in proportions, i.e., a test asymptotically optimal for local alternatives where the log odds vary in proportion with
score
. By default,score
is chosen as the group numbers.Usage
Arguments
x
Number of events
n
Number of trials
score
Group score
즉 x는 number of event, n은 number of trials로 전체 숫자를 가지고 하는 것이 맞습니다.