메뉴 건너뛰기

missing data 처리 관련 문의...

민트레몬 2020.06.11 12:27 조회 수 : 162



제가 missing data 때문에 이런저런 공부를 하고 있는데 명확한 답이 나오지 않아 너무 답답해 질문하나 드리고자 하니.. ㅠㅠ

시간 되시면 간단한 답변이라도 도움.. 꼭 좀 부탁드립니다.ㅠㅠ


제가 하는 분석의 핵심 독립변수가 차량소유(모델1)와 차량값(모델2)인데 (같이 투입하면 공선성 때문에 변수가 탈락하게 되어 모델을 구분함)

차량이 없는 사람은 차량값이 missing이 되는 것은 당연한 일인것 같습니다. missing비율은 35%정도 됩니다.

이 missing은 차량이 없어서 발생하는 NMAR일텐데

missing으로 두자니 분석에서 빠져버려 모델1과 모델2의 대상이 달라져버려

missing값을 0으로 처리하거나 다중대체법으로 값을 대체하는 방법을 생각하고 있는데..

차량이 없어 값이 없는게 당연한 차량값을 0이나 다른값으로 대체해서 분석하는게 괜찮은지에 대한 의문이 들어요..


만약 대체가 적절하지 않다면 이렇게 left censored된 독립변수를 처리하는 다른 기법이나 분석방법이 있을까요?


혹시 도움 주실말 있으시면 아무거나 부탁드립니다.. ㅠㅠ 죄송합니다..

번호 제목 글쓴이 날짜 조회 수
844 r studio 관련하여 문의드립니다. [1] jera0131 2020.06.15 2529
843 Propensity score matching 결과 standardized difference 에 대한 질문 nskjh 2020.06.15 1757
842 안녕하십니까 문의드립니다. [2] secret 놀라운본능 2020.06.14 12
841 정회원용 서버, survival analysis 점검 부탁드립니다. [2] kalmiash 2020.06.12 155
840 정회원 후원 했습니다. [1] secret kalmiash 2020.06.12 4
» missing data 처리 관련 문의... [1] 민트레몬 2020.06.11 162
838 PSM 에 대해서 문의 드립니다 [2] file jaljary 2020.06.10 304
837 책 관련 문의드립니다 [1] IMG마리 2020.06.10 832
836 propensity score matching 관련 질문입니다. [1] brillante 2020.06.10 193
835 질문드립니다 [1] qubic 2020.06.09 189
834 페이팔 결제 문의 [3] secret nj1 2020.06.08 5
833 cox 다변량 분석 결측치 처리 관련 질문드립니다 [1] sungmas 2020.06.08 1251
832 propensity score matching 관련 문의드립니다. [2] 소원성취 2020.06.08 205
831 다음과 같은 그림을 어떤 plot이라 하는지 여쭙습니다. [1] file sweetspirit 2020.06.06 140
830 apply 활용 질문 드립니다. [1] hazelous 2020.06.06 121
829 정회원 서버 갱신부탁드립니다. [1] secret neurojang 2020.06.06 2
828 heatmapannotation함수 질문입니다 [1] sungmas 2020.06.05 386
827 안녕하세요 선생님! ggRadar를 gganimate와 함께 활용하려다가 막혀서 질문글 올립니다. file 으니 2020.06.04 706
826 결제 관련 [1] nj1 2020.06.02 159
825 Web으로 하는 R meta 서비스 관련 [2] 묵사마 2020.06.01 166