메뉴 건너뛰기

웹에서 하는 R 통계

missing data 처리 관련 문의...

2020.06.11 12:27

민트레몬 조회 수:29



제가 missing data 때문에 이런저런 공부를 하고 있는데 명확한 답이 나오지 않아 너무 답답해 질문하나 드리고자 하니.. ㅠㅠ

시간 되시면 간단한 답변이라도 도움.. 꼭 좀 부탁드립니다.ㅠㅠ


제가 하는 분석의 핵심 독립변수가 차량소유(모델1)와 차량값(모델2)인데 (같이 투입하면 공선성 때문에 변수가 탈락하게 되어 모델을 구분함)

차량이 없는 사람은 차량값이 missing이 되는 것은 당연한 일인것 같습니다. missing비율은 35%정도 됩니다.

이 missing은 차량이 없어서 발생하는 NMAR일텐데

missing으로 두자니 분석에서 빠져버려 모델1과 모델2의 대상이 달라져버려

missing값을 0으로 처리하거나 다중대체법으로 값을 대체하는 방법을 생각하고 있는데..

차량이 없어 값이 없는게 당연한 차량값을 0이나 다른값으로 대체해서 분석하는게 괜찮은지에 대한 의문이 들어요..


만약 대체가 적절하지 않다면 이렇게 left censored된 독립변수를 처리하는 다른 기법이나 분석방법이 있을까요?


혹시 도움 주실말 있으시면 아무거나 부탁드립니다.. ㅠㅠ 죄송합니다..

번호 제목 글쓴이 날짜 조회 수
공지 묻고답하기 게시판을 운영합니다 [1] cardiomoon 2015.04.20 935
» missing data 처리 관련 문의... [1] 민트레몬 2020.06.11 29
611 PSM 에 대해서 문의 드립니다 [2] file jaljary 2020.06.10 61
610 propensity score matching 관련 질문입니다. [1] brillante 2020.06.10 45
609 질문드립니다 [1] qubic 2020.06.09 31
608 cox 다변량 분석 결측치 처리 관련 질문드립니다 [1] sungmas 2020.06.08 31
607 propensity score matching 관련 문의드립니다. [2] 소원성취 2020.06.08 37
606 다음과 같은 그림을 어떤 plot이라 하는지 여쭙습니다. [1] file sweetspirit 2020.06.06 35
605 apply 활용 질문 드립니다. [1] hazelous 2020.06.06 24
604 heatmapannotation함수 질문입니다 [1] sungmas 2020.06.05 49
603 안녕하세요 선생님! ggRadar를 gganimate와 함께 활용하려다가 막혀서 질문글 올립니다. file 으니 2020.06.04 206
602 F값을 이용하여 cohen's d 값 구하기 copycat 2020.06.01 35
601 용어 하나만 알려주세요 [2] copycat 2020.06.01 26
600 Propensity score matching 후 PS 값 얻기 큐큐 2020.05.31 36
599 정회원 문의 [2] copycat 2020.05.31 29
598 Propensity score matching 에서 IPTW 기법 [1] 큐큐 2020.05.29 69
597 안녕하십니까 선생님 R 조절효과회귀분석 질문드립니다ㅠ [2] dawwo 2020.05.29 23
596 상관분석의 p value를 알 수 있을까요? [1] 디프 2020.05.27 82
595 logistic regression 해석 문의 입니다. [1] 남세이짱 2020.05.26 37
594 length 오류질문 [1] 촙춉 2020.05.26 26
593 질문드립니다 qubic 2020.05.26 13