Skip to menu

missing data 처리 관련 문의...

민트레몬 2020.06.11 12:27 Views : 186



제가 missing data 때문에 이런저런 공부를 하고 있는데 명확한 답이 나오지 않아 너무 답답해 질문하나 드리고자 하니.. ㅠㅠ

시간 되시면 간단한 답변이라도 도움.. 꼭 좀 부탁드립니다.ㅠㅠ


제가 하는 분석의 핵심 독립변수가 차량소유(모델1)와 차량값(모델2)인데 (같이 투입하면 공선성 때문에 변수가 탈락하게 되어 모델을 구분함)

차량이 없는 사람은 차량값이 missing이 되는 것은 당연한 일인것 같습니다. missing비율은 35%정도 됩니다.

이 missing은 차량이 없어서 발생하는 NMAR일텐데

missing으로 두자니 분석에서 빠져버려 모델1과 모델2의 대상이 달라져버려

missing값을 0으로 처리하거나 다중대체법으로 값을 대체하는 방법을 생각하고 있는데..

차량이 없어 값이 없는게 당연한 차량값을 0이나 다른값으로 대체해서 분석하는게 괜찮은지에 대한 의문이 들어요..


만약 대체가 적절하지 않다면 이렇게 left censored된 독립변수를 처리하는 다른 기법이나 분석방법이 있을까요?


혹시 도움 주실말 있으시면 아무거나 부탁드립니다.. ㅠㅠ 죄송합니다..

No. Subject Author Date
1093 Box plot 그리프 설정에 관해 문의합니다. papahong 2022.06.20
1092 cluster data 의 risk difference 에 대해 여쭙고자 합니다. lagrima 2022.06.19
1091 Pair plot을 할 경우 [1] PipeDragoN 2022.06.13
1090 PSM에서 matching 버튼 위치 문의 통계어려워 2022.06.13
1089 PSM (4그룹) 관련 문의드립니다. emksh77 2022.06.08
1088 정회원후원하였습니다. [1] secret rosemary 2022.06.08
1087 PSM 문의 [2] secret sfumatoi 2022.06.07
1086 multipleROC 패키지에서 multivariable의 cutoff 구하기 file 찬쓰 2022.06.07
1085 survival analysis관련 문의 드립니다 [1] cebukim 2022.06.04
1084 autoReg 설치 관련 오류 [5] 닥터강 2022.05.24
1083 survival tree (RPA) 분석 관련 문의 드립니다. [2] 곰곰11 2022.05.23
1082 통계 질문입니다. [1] file 봄봄봄 2022.05.23
1081 데이터 불러오기 문제 [3] strat 2022.04.25
1080 r프로그래밍 문자는 factor로 읽을 수 없나요? [1] file 채채채추ㅐㅊ채야채 2022.04.21
1079 R 코드와 관련하여 문의 드려도 될까요..? [5] file 꾸이뭉 2022.04.19
1078 R 업데이트 후 mytable 함수 에러가 있습니다. [1] 카이토르 2022.04.18
1077 Survival curve 에서 cumulative incidence % 로 표현 가능할까요 [1] nyknicks 2022.04.16
1076 multiple logistic regression test에서 설명변수 선택에 대해 여쭙습니다. [2] file kms9057 2022.04.16
1075 PSM 문의 드립니다 [1] caesar 2022.04.07
1074 Survival regression에서 Survival probability 그래프에서 회색음영이 무엇인지요? [2] file 케로스 2022.03.24