안녕하세요
저는 최근 R 공부를 시작하고 있습니다.
제가 가지고 있는 데이터로 PSM을 해보고 있는데
에러를 이해하지 못하겠어서 문의글을 작성하게 되었습니다.
PSM 이후 매칭된 환자의 수가 달라진 것이 에러인데요.
예를 들어, 제가 A 약물을 복용하는 환자군을 기준으로 매칭을 한다고 할때.
실제 데이터에서 A약물을 복용하는 환자는 139명이고, 복용하지 않는 환자는 10000명이라고 하고요.
이때, 1:1로 PSM을 한다고 하면 적어도 복용하는 환자는 139명, 복용하지 않는 환자는 130명 비슷하게 나와야하지 않나요?
근데 제가 시행했을 때는 (MATCHIT, nearest) (변수는 age, sex) (기준은 A약물복용력)
A 약물 복용하는 환자가 201명, 복용하지 않는 환자가 200여명정도가 나옵니다.
뭐가 잘못됐는지 아무리 찾아봐도 잘 모르겠어서요
이렇게 나오는 이유가 무엇인지,
어떻게 수정해야 제대로 나오는지 궁금합니다.
Comment 4
-
cardiomoon
2021.03.23 22:48
-
뽀오또
2021.03.24 18:55
네 제가 현재 가지고 있는 데이터를 몇개의 변수를 지우고 올려보겠습니다.
좀 변수가 많습니다.
저의 데이터는 C302라는 변수가 1인 환자를 기준으로(139명) matching 을 하고 싶습니다.
> match_C3 <- matchit(C302~ BX_AGE + A_SEX, method='nearest', data=C3_4, ratio=1)
> matched <- match.data(match_C3)
> dim(matched)
[1] 276 129
이렇게 나옵니다. 1:1 매칭인데 왜 2배 가까이 더 나오는지 모르겠습니다.
원래 데이터에서는 204:201 정도로 나왔었는데 139명보다 더 많이 나오는 이유도 모르겠습니다.....
뭐가 문제일까요...?
-
cardiomoon
2021.03.25 10:25
올려주신 데이터로 점검해보니 대조군과 치료군 모두 138명 씩 매칭됩니다. 위의 코드에서 summary(match_C3) 해보시면 양군간에 매칭된 수치를 확인하실 수 있습니다. 또한 dim(matched) 는 matched 데이터의 행갯수와 열갯수를 보여주는 명령어로 데이터가 모주 276행 및 129개의 열이라는 뜻입니다. table(matched$C302) 해보시면 대조군, 치료군 모두 138 명인 것을 알 수 있습니다.
-
뽀오또
2021.03.25 15:18
아.....넵~!!
제가 명령어 이해가 부족해서 벌어진 일이군요.
정말 감사합니다~!!!
No. | Subject | Author | Date |
---|---|---|---|
1094 | 로지스틱 회귀분석 관련 질문 [2] | alse | 2016.06.18 |
1093 | 나무 분석 결과 문제 [3] | 매일이5월 | 2016.06.19 |
1092 | linear regression에서 회귀모형 적합성 여부 [3] | 매일이5월 | 2016.06.19 |
1091 | 학생강의project2 | cardiomoon | 2016.06.21 |
1090 | ROC 분석중 문제가 생겨서 질문 드립니다 [2] | candid00 | 2016.06.26 |
1089 | moonBook2 install중 error message [2] | hawk1227 | 2016.06.27 |
1088 | 표 만들기에서 에러가 생깁니다 [2] | jaljary | 2016.06.27 |
1087 | 선그래프 질문드립니다. [2] | 도치맘 | 2016.07.02 |
1086 | plot.or그래프 그리는 방법 [4] | 두치님 | 2016.07.04 |
1085 | 교수님 결측치 관련하여 문의드립니다. [1] | tunneled_vision | 2016.07.07 |
1084 | 질문드립니다. [1] | 죵죵죵 | 2016.07.10 |
1083 | ROC에서 여러설명변수 갖는 model간 비교 [5] | alse | 2016.07.11 |
1082 | excel 변환 부탁드립니다. [3] | 죵죵죵 | 2016.07.12 |
1081 | 다중 선형 회귀 분석에서 "relative importance of predictor variables"에 관해 질문드립니다. [2] | Ikarus86 | 2016.07.13 |
1080 | 시계열 회귀와 회귀 [1] | 반디12 | 2016.07.19 |
1079 | 데이타 선택 [4] | 김현정 | 2016.07.19 |
1078 | 로그변환 후 회귀분석 시 결과물 [1] | 반디12 | 2016.07.19 |
1077 | 데이터 분석 후 예상과 결과가 다를 때, [1] | 반디12 | 2016.07.19 |
1076 | 샘플사이즈 문제 [3] | 반디12 | 2016.07.20 |
1075 | 표만들기에서 이런 에러가 생기는데 뭐가 문제인지요? [2] | 지훈이아빠 | 2016.07.22 |
안녕하세요? 사용하신 데이터와 R코드를 올려주시면 한번 검토해보겠습니다