Skip to menu

missing data 처리 관련 문의...

민트레몬 2020.06.11 12:27 Views : 187



제가 missing data 때문에 이런저런 공부를 하고 있는데 명확한 답이 나오지 않아 너무 답답해 질문하나 드리고자 하니.. ㅠㅠ

시간 되시면 간단한 답변이라도 도움.. 꼭 좀 부탁드립니다.ㅠㅠ


제가 하는 분석의 핵심 독립변수가 차량소유(모델1)와 차량값(모델2)인데 (같이 투입하면 공선성 때문에 변수가 탈락하게 되어 모델을 구분함)

차량이 없는 사람은 차량값이 missing이 되는 것은 당연한 일인것 같습니다. missing비율은 35%정도 됩니다.

이 missing은 차량이 없어서 발생하는 NMAR일텐데

missing으로 두자니 분석에서 빠져버려 모델1과 모델2의 대상이 달라져버려

missing값을 0으로 처리하거나 다중대체법으로 값을 대체하는 방법을 생각하고 있는데..

차량이 없어 값이 없는게 당연한 차량값을 0이나 다른값으로 대체해서 분석하는게 괜찮은지에 대한 의문이 들어요..


만약 대체가 적절하지 않다면 이렇게 left censored된 독립변수를 처리하는 다른 기법이나 분석방법이 있을까요?


혹시 도움 주실말 있으시면 아무거나 부탁드립니다.. ㅠㅠ 죄송합니다..

No. Subject Author Date
1134 교수님 일전에 메타분석 문의드렸던 사람입니다 [2] 카우보이 2016.04.13
1133 접속오류 [1] secret 김승욱 2016.04.18
1132 메타분석에서 설명변수와 조절변수 차이 문의 file 딩크형 2016.04.19
1131 정규성 검정에 대해서 여쭤봅니다. [2] file R까기 2016.04.22
1130 데이타 업로드후 작업이 안됩니다. T.T [1] 유로정 2016.04.22
1129 회기분석 결과를 통해 HR 표기하기 [2] file arranger 2016.04.24
1128 csv파일 업로드 안되는 문제 [2] file 신돌석 2016.04.25
1127 예제 데이터 열 제목 편집방법 [2] 신돌석 2016.04.25
1126 Survival 분석에서 cumulative proportion과 95% CI [2] namuhanayeyo 2016.04.26
1125 R과 SPSS에서 시행한 logistic regression값은 거의 일치하는데, Web-R에서 돌린 것은 일치하지가 않습니다. [2] file namuhanayeyo 2016.04.27
1124 2 X 2 table에서 categorical variable을 비교한 P 값 [2] namuhanayeyo 2016.05.01
1123 [비교통계] 결과가 나오도록 하는 방법 [3] 신돌석 2016.05.01
1122 생존분석에 대해서 문의드립니다. [1] 유로정 2016.05.03
1121 메타분석에서 forest plot 크기 [1] file SumiHan 2016.05.04
1120 한 발 앞서 배워보는 Xamarin! cardiomoon 2016.05.09
1119 RStudio 문의 드립니다. [1] secret nipponica 2016.05.09
1118 메타분석 forest plot [2] secret SumiHan 2016.05.11
1117 ggplot2 와 web-r 의 plot 의 색 채우기 문의 [2] 화모기 2016.05.13
1116 반복측정자료의 분석 [2] file arranger 2016.05.14
1115 생존분석 질문입니다 [3] 난둥 2016.05.24