안녕하세요.
R studio로 분석을 하다가 의문점이 있어 글을 남깁니다.
우선 제 dataset에 60개의 변수가 있다고 하면,
그 중 10개의 변수 (column 2-10)에 대해서만 multiple imputation을 하고 싶습니다.
그 이후 이 10개의 변수를 포함하여 propensity score matching을 MatchIt으로 할려고 합니다.
Original dataset에서 column을 추출하여 imputation 하는 것까지는 했습니다만,
이 추출된 data (10개의 column만 존재)를 original data (60개의 column이 존재하며 column 2-10은 결측치로 되어 있음)와
어떻게 합쳐야 하는지 검색을 해봐도 잘 모르겠습니다.
Original data에 무작정 MICE package를 적용하면
제가 보고자 하는 10개의 변수 이외에 전혀 의미가 다른 기타 변수들까지도 포함되어 imputation이 되는 것 같고,
그러면 정확한 imputation이 되지 않을 것 같습니다 (전혀 상관 없는 변수들이 모델에 포함되니까요...?).
또한 변수가 많다보니 original dataset에서 MICE package를 무작정 실행시켰을 때 시간이 너무 오래 걸려 어차피 결과도 보지 못했습니다.
게시판 검색을 하다 보니 책에 설명이 있는 것 같기도 한데,
현재 해외에 있어 해외 카드 때문인지 몰라도 알라딘에서도 결제가 되지 않습니다 ㅠㅠ
정리하면, original dataset에서 특정 칼럼끼리만 multiple imputation을 하고 (나머지 column은 제외)
imputed value를 기존 결측치 대신 넣어서 updated original dataset을 만드는 방법을 알고 싶습니다.
감사합니다.
Comment 1
-
cardiomoon
2019.03.17 19:20
No. | Subject | Author | Date |
---|---|---|---|
1053 | 통계와 관련한 기초적인 질문 드립니다.. [2] | 감사합니다 | 2021.12.10 |
1052 | 메타분석 해석 문의 [2] | 루아로 | 2021.12.07 |
1051 | 초보라 질문드립니다 ㅜ [2] | 쵸쿄쵸쿄 | 2021.12.06 |
1050 | ㅠㅠㅠ 초보 질문입니다 [1] | 만고 | 2021.11.26 |
1049 | 라벨붙이기가 안됩니다 [1] | 찬미맘 | 2021.11.22 |
1048 | moonBook ANOVA 질문드립니다. [1] | 타쿠 | 2021.11.20 |
1047 | 3원 분할표? 에서 모델 만드는법 | 플랫슬립 | 2021.11.20 |
1046 | [회귀분석 초급 질문] [1] | 서빱스 | 2021.11.14 |
1045 | [ANOVA 분석 질문] [1] | 서빱스 | 2021.11.14 |
1044 | 대조군1과 치료군2,3,4 의 PSM 에 관해서 질문있습니다. [4] | yessul | 2021.11.11 |
1043 | 서버접속이 안됩니다. Reload [2] | silkywater | 2021.11.11 |
1042 | 메타분석 실행이 안됩니다. [1] | 애플K | 2021.11.08 |
1041 | pair plot 관련하여 질문드립니다. | ulysses11 | 2021.10.29 |
1040 | 메타분석 결과파일 다운로드 하려면 [1] | mono | 2021.10.23 |
1039 | 기본 baseline character table문의드립니다. [1] | ulysses11 | 2021.10.22 |
1038 | 이 error는 뭐가 문제인 걸까요 [1] | CSJU | 2021.10.19 |
1037 | logistic regression에서 p>0.05인 변수의 OR, p 값... | 브이콘65 | 2021.10.14 |
1036 | R 문제가 도저히 안풀려요.. [1] | 자하연미필 | 2021.10.09 |
1035 | 구조방정식에서 종속변수가 0,1로 코딩된 데이터 사용이 가능한가요? [1] | 순수엄마 | 2021.10.08 |
1034 | roc.test를 통해 AUC 비교 [2] | 나현둥 | 2021.10.07 |
네 그런 목적이시라면 FHDI 이라는 패키지를 사용해보실 것을 권합니다. CRAN에 등록되어 있습니다. 다음 글을 참조하세요
https://journal.r-project.org/archive/2018/RJ-2018-020/RJ-2018-020.pdf