안녕하세요.
R studio로 분석을 하다가 의문점이 있어 글을 남깁니다.
우선 제 dataset에 60개의 변수가 있다고 하면,
그 중 10개의 변수 (column 2-10)에 대해서만 multiple imputation을 하고 싶습니다.
그 이후 이 10개의 변수를 포함하여 propensity score matching을 MatchIt으로 할려고 합니다.
Original dataset에서 column을 추출하여 imputation 하는 것까지는 했습니다만,
이 추출된 data (10개의 column만 존재)를 original data (60개의 column이 존재하며 column 2-10은 결측치로 되어 있음)와
어떻게 합쳐야 하는지 검색을 해봐도 잘 모르겠습니다.
Original data에 무작정 MICE package를 적용하면
제가 보고자 하는 10개의 변수 이외에 전혀 의미가 다른 기타 변수들까지도 포함되어 imputation이 되는 것 같고,
그러면 정확한 imputation이 되지 않을 것 같습니다 (전혀 상관 없는 변수들이 모델에 포함되니까요...?).
또한 변수가 많다보니 original dataset에서 MICE package를 무작정 실행시켰을 때 시간이 너무 오래 걸려 어차피 결과도 보지 못했습니다.
게시판 검색을 하다 보니 책에 설명이 있는 것 같기도 한데,
현재 해외에 있어 해외 카드 때문인지 몰라도 알라딘에서도 결제가 되지 않습니다 ㅠㅠ
정리하면, original dataset에서 특정 칼럼끼리만 multiple imputation을 하고 (나머지 column은 제외)
imputed value를 기존 결측치 대신 넣어서 updated original dataset을 만드는 방법을 알고 싶습니다.
감사합니다.
Comment 1
-
cardiomoon
2019.03.17 19:20
No. | Subject | Author | Date |
---|---|---|---|
694 | web-R 기반 분석 후 다운로드 관련 문의점 | kato7 | 2019.02.11 |
693 | mytable 관련 질문드립니다 [3] | 낡은찻잔 | 2019.02.12 |
692 | 정회원 서버 신청 문의입니다. [2] | chl065512 | 2019.02.13 |
691 | Survdiff로 log-rank test 시 P-value 소수점 [3] | begabung | 2019.02.15 |
690 | 회귀분석에서의 범주형변수 [4] | 에곤쉴레 | 2019.02.20 |
689 | 범주형 변수 생존 분석시 log rank와 cox univariate 결과 해석에 대해 질문 드립니다. [1] | 소외 | 2019.02.20 |
688 | mytable 함수 에러 [3] | iddrlee | 2019.02.21 |
687 | ORplot 관련하여 질문드립니다. | 매직하마 | 2019.02.23 |
686 | matchIt 함수 사용시 질문 있습니다. [1] | YJK | 2019.02.23 |
685 | forest plot 그리는 법 문의 드립니다. [1] | 강민정 | 2019.02.24 |
684 | 변수선택 관련 질문 드립니다. [1] | chamchi | 2019.02.28 |
683 | 표만들기 오류 [1] | 김밥친구 | 2019.03.03 |
682 | 생존분석 질문입니다. [2] | 박소이 | 2019.03.06 |
681 | diagnostic accuracy [1] | 쑤니 | 2019.03.07 |
680 | 안녕하세요. 문의드립니다. (R-meta) [2] | 슬태 | 2019.03.09 |
679 | 생존분석 오류 [1] | jjunglammy | 2019.03.12 |
» | 특정 column만 MICE package로 multiple imputation [1] | brillante | 2019.03.16 |
677 | PSM 에서의 문의 [1] | 김날 | 2019.03.18 |
676 | 교수님 질문이 있습니다. [4] | 박소이 | 2019.03.20 |
675 | ggplot2을 이용한 density 그래프 그리기 [1] | Minxo | 2019.03.22 |
네 그런 목적이시라면 FHDI 이라는 패키지를 사용해보실 것을 권합니다. CRAN에 등록되어 있습니다. 다음 글을 참조하세요
https://journal.r-project.org/archive/2018/RJ-2018-020/RJ-2018-020.pdf