Skip to menu

완전 초보가 web-R로 통계 입문해서 많은 도움을 받고 있습니다. 감사합니다 교수님.


"의학논문작성을 위한 R 통계와 그래프"책을 보고 결측치 처리를 위해 MICE를 사용하여 처리를 연습하고 있습니다만


MICE함수에  cox regression 함수를 집어넣어서 처리하는 것이 가능한지요? 경고메시지가 뜨면서 처리값중 df가 제대로 처리되지 않는 것처럼 보였습니다.


첨부된 파일은 전체파일로 돌리면 너무 느려서 연습용으로 아주 일부만 발췌한 파일입니다만, 


첨부파일중 SUBJECT_NO를 제외하고 나머지 변수를 투입해서  RE_EVENT를 사건, RE_YEAR를 생존기간으로 해서 cox regression을 할 계획이었습니다.


책을 참고하여 넣은 명령문은 다음과 같았습니다. 여기서는 들어가는 변수를 4개만 넣어서 연습해 보았었습니다.

data=read.csv("CKD_COX100.csv")
data
require(mice)
require(survival)
imp=mice(data,m=5,seed=1234)
fit1=with(imp,coxph(Surv(RE_YEAR,RE_EVENT==1)~ATRH+log_protein+BMI1+CCV_Hx))
pooled=pool(fit1)
summary(pooled)
pooled


경고메시지는 pool함수 사용시 발생했고 다음과 같았습니다.

> pooled=pool(fit1)
Warning messages:
1: Unknown or uninitialised column: 'df.residual'. 
2: In pool.fitlist(getfit(object), dfcom = dfcom) : Large sample assumed.
>
> pooled
Class: mipo    m = 5 
               estimate        ubar            b           t  dfcom       df          riv       lambda          fmi
ATRH         1.00980260 0.318820965 1.102597e-04 0.318953277 999999 958369.3 0.0004150029 0.0004148307 0.0004169167
log_protein  0.46618838 0.013448747 1.000273e-05 0.013460750 999999 833549.7 0.0008925200 0.0008917241 0.0008941214
BMI1        -0.07057015 0.003690066 5.613955e-06 0.003696803 999999 545840.1 0.0018256438 0.0018223169 0.0018259743
CCV_Hx       0.23557745 0.244975757 2.626380e-05 0.245007274 999999 995749.7 0.0001286518 0.0001286352 0.0001306435

pooled를 확인해 볼시 dfcom이 999999로 나타나서 문제가 있는 것으로 생각했습니다 완전 생초보가 교수님께 고견을 여쭙습니다.... 언제나 감사합니다.