메뉴 건너뛰기

웹에서 하는 R 통계

교수님, 안녕하십니까? mytable과 multipleROC를 특히 유용하게 잘 쓰고 있는 연구자입니다.

 

다름이 아니라, multivariable logistic regression analysis를 시행하여 dichotomous한 outcome에 대해 6개의 factor가 유의미하다는 사실을 확인하였고, 이에 대한 ROC curve를 6개 factor를 모두 넣어 확인해 본 결과 AUC값은 0.981 로 확인되는 상태입니다. 하나하나 했을 때는 0.8~0.9 사이인 것에 비해 월등한 결과입니다.

multipleROC_PCT_train.png

 

여기서 요지는, 이렇게 나온 ROC curve에서 6개 factor 모두의 optimal cutoff를 찾고 싶은데, multipleROC package에서 automatic 하게 계산되어 나오는 값은 Youden's index (sensitivity+specificity가 최대값인 포인트) 결과대로 나오는 것 같은데 이 값은 제가 보여주고자 하는 값이 아닙니다. 그래서 sensitivity와 specificity를 곱한 값이 최대인 포인트를 확인하고 싶은데 multivariable 이 입력된 ROC curve에서는 이 값을 어떻게 찾을 수 있는지 잘 모르겠습니다. 구글링을 해보면 

y= b0 + b1X1 + b2X2 + b3X3 ... 이렇게 수식이 만들어지기 때문에 optimal 한 X1, X2, X3 (multivariables) 의 값을 구할 수가 없다고 하는데 multipleROC에서는 그 값이 나오더라구요. 

 

multipleROC_all_train.png

 

 

혹시 single variable에 대한 ROC curve에서 optimal cutoff를 찾을때처럼 lr.eta 값으로 raw variable의 값을 추정할 수 있는 수식이 있을까요? 아래와 같이 말입니다.

 

#######

x<- multipleROC(shock_sepsis3~PCT, data=train)

x$fit

write.csv(x$df, 

          "PCT.csv")

fit <- glm(shock_sepsis3~PCT, data=train, family= binomial)

 

(qlogis(x$cutpoint)-unname(coef(x$fit)[1]))/unname(coef(x$fit)[2])

(qlogis(0.607635)-unname(coef(x$fit)[1]))/unname(coef(x$fit)[2])      ## multiplication

########

 

github에 올려주신 코드를 봐도 어떻게 계산되어 나오는 것인지 이해가 되지 않아 여쭤봅니다.

 

고진선처 부탁드립니다. 감사합니다.

번호 제목 글쓴이 날짜 조회 수
공지 묻고답하기 게시판을 운영합니다 [1] cardiomoon 2015.04.20 8515
806 심평원 R studio 내 lubridate 설치 오류 [4] 꾸이뭉 2022.06.27 10
805 PSM full matching, Probit, ATE 관련 문의드립니다 cebukim 2022.06.25 9
804 Box plot 그리프 설정에 관해 문의합니다. papahong 2022.06.20 9
803 cluster data 의 risk difference 에 대해 여쭙고자 합니다. lagrima 2022.06.19 9
802 Pair plot을 할 경우 [1] PipeDragoN 2022.06.13 18
801 PSM에서 matching 버튼 위치 문의 통계어려워 2022.06.13 12
800 PSM (4그룹) 관련 문의드립니다. emksh77 2022.06.08 17
» multipleROC 패키지에서 multivariable의 cutoff 구하기 file 찬쓰 2022.06.07 21
798 survival analysis관련 문의 드립니다 [1] cebukim 2022.06.04 33
797 autoReg 설치 관련 오류 [5] 닥터강 2022.05.24 37
796 survival tree (RPA) 분석 관련 문의 드립니다. [2] 곰곰11 2022.05.23 23
795 통계 질문입니다. [1] file 봄봄봄 2022.05.23 27
794 데이터 불러오기 문제 [3] strat 2022.04.25 69
793 r프로그래밍 문자는 factor로 읽을 수 없나요? [1] file 채채채추ㅐㅊ채야채 2022.04.21 56
792 R 코드와 관련하여 문의 드려도 될까요..? [5] file 꾸이뭉 2022.04.19 72
791 R 업데이트 후 mytable 함수 에러가 있습니다. [1] 카이토르 2022.04.18 86
790 Survival curve 에서 cumulative incidence % 로 표현 가능할까요 [1] nyknicks 2022.04.16 56
789 multiple logistic regression test에서 설명변수 선택에 대해 여쭙습니다. [2] file kms9057 2022.04.16 50
788 PSM 문의 드립니다 [1] caesar 2022.04.07 83
787 Survival regression에서 Survival probability 그래프에서 회색음영이 무엇인지요? [2] file 케로스 2022.03.24 66