교수님 안녕하세요
교수님이 쓰신 r통계와 그래프 및 웹에서 하는 r 통계를 참고로 많이 배우고 있습니다.
지금 초보적이지만 r을 쓰려고 노력하고 있는데요
여기 web-r에서 하는 것처럼 multivariable logistic regression에서 p value가 0.2이상인 것을 자동으로 골라서
multivariable analysis를 r 에서도 구현하고 싶습니다.
현재는 제가 하고 있는 방법은 각각 univariate로 (glm) 돌려서 그중에서 매뉴얼로 제가 p가 0.2이상인것을 골라서
full model을 glm로 만든후 step을 사용해서 시행하고 있습니다
(spss에서 돌리는 것과 비슷하게 하고 있습니다)
full.model=glm(Murder-a+b+c+d ,data=states)
reduced .model=step (full.model ,direction= "backward" )
하지만 변수가 많아지니까 30개 넘는 것에서 고르는 곳도 생각보다 시간도 오래걸리고 실수할 확률도 높아지는거 같아서요
혹시 full.model에서 전부 넣고 step을 사용하면 자동으로 p value 0.2이상인 것만 multivariable에 들어가게 되는건가요??
web-r처럼 p value 를 조정하려면 어떻게 해야하나요?;
그리고 자동이라면 multivable로 들어가는 것은 무엇인지 어떻게 알게되나요??
그리고 r통계와 그래프에서 보면 AIC로 하는 방법도 있다고 하시고 또한 shrinkageO 패키지와 all subset regression을 사용하는 법도 언급하셨는데요.
어느 방법의 사용을 추천하시는지도 궁금합니다-!
감사합니다-!!
Comment 2
-
cardiomoon
2017.07.14 15:18
-
권혜미
2017.07.14 17:26
그렇다면 혹시......
univariate에서 p<0.2이하인 것을 자동으로 선택하는 패키지나 코드가 잇을까요?ㅠㅠ
현재는 variable들 glm(A~variable1개, data=abc)을 lapply로 해서 나온 결과를 결과 나온걸 제가 매뉴얼로 고르고 잇습니다.ㅠ
No. | Subject | Author | Date |
---|---|---|---|
1094 | 로지스틱 회귀분석 관련 질문 [2] | alse | 2016.06.18 |
1093 | 나무 분석 결과 문제 [3] | 매일이5월 | 2016.06.19 |
1092 | linear regression에서 회귀모형 적합성 여부 [3] | 매일이5월 | 2016.06.19 |
1091 | 학생강의project2 | cardiomoon | 2016.06.21 |
1090 | ROC 분석중 문제가 생겨서 질문 드립니다 [2] | candid00 | 2016.06.26 |
1089 | moonBook2 install중 error message [2] | hawk1227 | 2016.06.27 |
1088 | 표 만들기에서 에러가 생깁니다 [2] | jaljary | 2016.06.27 |
1087 | 선그래프 질문드립니다. [2] | 도치맘 | 2016.07.02 |
1086 | plot.or그래프 그리는 방법 [4] | 두치님 | 2016.07.04 |
1085 | 교수님 결측치 관련하여 문의드립니다. [1] | tunneled_vision | 2016.07.07 |
1084 | 질문드립니다. [1] | 죵죵죵 | 2016.07.10 |
1083 | ROC에서 여러설명변수 갖는 model간 비교 [5] | alse | 2016.07.11 |
1082 | excel 변환 부탁드립니다. [3] | 죵죵죵 | 2016.07.12 |
1081 | 다중 선형 회귀 분석에서 "relative importance of predictor variables"에 관해 질문드립니다. [2] | Ikarus86 | 2016.07.13 |
1080 | 시계열 회귀와 회귀 [1] | 반디12 | 2016.07.19 |
1079 | 데이타 선택 [4] | 김현정 | 2016.07.19 |
1078 | 로그변환 후 회귀분석 시 결과물 [1] | 반디12 | 2016.07.19 |
1077 | 데이터 분석 후 예상과 결과가 다를 때, [1] | 반디12 | 2016.07.19 |
1076 | 샘플사이즈 문제 [3] | 반디12 | 2016.07.20 |
1075 | 표만들기에서 이런 에러가 생기는데 뭐가 문제인지요? [2] | 지훈이아빠 | 2016.07.22 |
1) step함수는 p값과 상관없이 AIC 값을 기준으로 모형을 골라줍니다.
2) full model에 어떤 설명변수를 넣을지는 연구자가 정하는 것입니다. 웹R에서는 univariate analysis를 해서 사용자가 정해준 p 값의 threshold 이하인 것을 골라서 full model에 넣어줍니다.
(하나하나 비교하는 것입니다.)
3) step() 함수의 결과와 all subset regression의 결과, Cp plot의 결과가 일치하면 좋겠지만 일치하지 않는다면 연구자가 골라야 하겠죠.^^