교수님께,
로지스틱 회귀분석과정중 질문 있어 문의드립니다.
회귀분석후 stepwise (backward elimination) 분석을 시행하며
다음과 같은 에러가 발생합니다.
> backwardlogi=step(logi_SCI, direction = "backward")
Start: AIC=90.76
mortality ~ noso + hepabiliary + appro + invasive + Charlson.s.Score +
Pitt.bacteremia.score
Df Deviance AIC
- appro 1 76.840 88.840
- invasive 1 77.928 89.928
<none> 76.760 90.760
- hepabiliary 1 79.347 91.347
- noso 1 81.333 93.333
- Charlson.s.Score 1 94.757 106.757
- Pitt.bacteremia.score 1 97.144 109.144
Error in step(logi_SCI, direction = "backward") :
행의 개수가 변경되었습니다: 결측치들을 제거했나요?
기본회귀 일때는 디폴트로 listwise deletion 했서 문제 없었던 것 같은데..n 수가 많지 않아 결측치 있는 데이터도 최대한
포함해서 분석하고 합니다.
이러한 에러의 원인은 무엇이며, 어떻게 해결하면 좋을지 이리저리 찾아봐도 명확한 답을 찾을 수 없어 이렇게 질문드립니다.
항상 책과 강의를 통해 많은 도움 받고 있습니다. 감사드립니다!
Comment 2
-
아빠가들려주는통계김지형
2019.02.21 10:41
-
매직하마
2019.02.23 13:37
답변 정말 감사합니다!!^^
기본적으로 listwise deletion이 아닌 상태로 실행할 수가 없습니다.
regression에서 말이죠.
대신에 비어있는 값을 적절한 방법으로 impution 시켜야 하고,
그렇게 해서 실행하는 방법이 R에도 이미 나와있습니다.
대표적인 방법이 multiple impution이고요,
web-R에서도 곧 실행될 것입니다.
잠시만 기다리시면,
그런데 무엇보다 중요한 것은
다변수 분석을 시행하는데, n수가 적다면 사실 분석에 의미가 적어집니다.
충분히 많은 수가 있어야. 다양한 변수에 따른 영향을 판단할 수 있겠지요.