로지스틱 회귀분석에 관하여 질문드립니다.

tympa 2015.12.09 08:10 Views : 1594

안녕하십니까?

선생님의 책을 통해 공부하면서 로지스틱 회귀분석을 해보고 있는데요, 궁금한 것이 있습니다.

'웹에서 클릭만으로 하는 R통계분석' 59쪽의 결과물에서도 나온 것처럼, backward regression 최종모형에서 p-value가 0.05보다 큰데도 불구하고 모형에 남아있는 변수들이 있습니다. 이것이 함수에서 p-value를 0.05보다 큰 값(예를 들면 0.1)으로 잡아서 그런 것인지, 아니면 그냥 glm 함수에서 완벽한 모델에 이르지 못해서 그런 것인지 궁금합니다. 예전에 최종모형에서 0.05보다 큰 변수를 제거한 모델과 anova 명령어를 사용해서 비교해보니 유의한 차이가 없는 것으로 나오는 것을 본 적이 있는데, 그렇다면 더 작은 모형을 제시하는게 맞는 것인지, 아니면 최종모형을 그대로 보고해도 되는 것인지요?
다른 SPSS를 사용하는 통계학 교재에서 모델 검정과정에서 Hosmer Lemeshow Goodness-of-fit test 같은 것을 사용해서 모형의 적합성을 판단하는 내용을 본 적이 있는데요, R을 사용한 교재들에서는 이러한 검정에 대한 내용이 없더군요. 굳이 이러한 검정을 하지 않더라도 결과 보고에 큰 문제는 없는 건지요?

아무래도 통계분석에는 초보이고, 모르는 상황에서 혼자 힘으로 해결하려고 하다보니 통계결과보고에서 지적을 받지 않을까 하는 걱정부터 드는군요^^:

너무 초보적인 질문일지 모르겠습니다만, 부족한 부분을 깨우쳐 주시면 감사하겠습니다.

I want to

List

Comment 2

cardiomoon

2015.12.09 18:12

1. 다중회귀모형에서 "최선의" 회귀모형을 고르는 가장 좋은 하나의 기준은 없습니다. 크게 R2를 사용하는 방법, adjusted-R2를 사용하는 방법, AIC를 사용하는 방법 등이 있는데 웹R에서 사용하는 방법은 step()함수를 사용하며 이 함수는 AIC 값을 기준으로 AIC값이 적은 모형을 선택하게 됩니다. 즉 p값을 기준으로 모형을 선택하는 것이 아니라 AIC(AKAIKE'S AN INFORMATION CRITERION)을 기준으로 모형을 선택합니다. 자세한 내용은 제가 쓴 "의학논문작성을 위한 R통계와 그래프" 책 300-308페이지 최선의 회귀모형 고르기 부분을 참조해주세요.

2. 59페이지에 있는 것은 대장암의 치료가 control, Lev,Lev+5FU 세군으로 나누어져 있습니다. rxLev로 되어 있는 항목은 control과 LEV간의 p값이며 rxLEV+5FU는 control과 LEV+5FU 군 을 비교한 p값입니다. 이러한 경우 rxLEV+5FU이 통계적으로 의미가 있으므로 모형에 계속 남아있는 것입니다.

3. Hosmer Lemeshow Goodness-of-fit test를 R에서도 할수 있지만 앞서 말씀드린대로 웹R에서는 모형의 선택은 AIC를 기준으로 한 후에 anova로 모형을 비교해줍니다. 굳이 GOF 검정을 할 필요는 없는 것 같습니다.

Comment
tympa

2015.12.09 22:00

아...그렇군요~~

선생님 덕분에 내용이 정리되는 것 같습니다.너무나 감사합니다^^

Comment

No.	Subject	Author	Date
1194	상호작용효과를 폴리곤 그래프로 만들 때 오류 [3]	반디12	2016.01.12
1193	생존분석에서 Status 선택 에러 [2]	규리맘	2016.01.14
1192	ROC 커브에 관련된 글을 읽고 R로 따라하다가 질문드립니다. [5]	Victo	2016.01.15
1191	Console 에 관한 질문입니다. [2]	R까기	2016.01.15
1190	ROC 커브에 대한 다른 질문입니다. [1]	Victo	2016.01.15
1189	ggrm 에러 [1]	규리맘	2016.01.20
1188	standard error 에 관한 질문입니다. [6]	R까기	2016.01.28
1187	성향점수 맞추기에서 질문드립니다. [5]	hawk1227	2016.01.30
1186	클리블랜드 점그래프 그리기 오류 관련 [5]	Mefirst~!	2016.02.09
1185	두 검사법끼리의 비교는 어떤 통계를 이용해야 할까요? [1]	피터팬79	2016.02.14
1184	생존분석 관련 질문입니다 [1]	크론벤	2016.02.17
1183	R초보이자 Web-R 초보로서 기본적 질문 몇가지를 여쭙습니다. [1]	보석	2016.02.17
1182	웹에서 클릭만으로 하는 R통계분석에서 궁금한점 [2]	osr33260216	2016.02.18
1181	웹에서 클릭만으로 하는 R통계 [2]	osr33260216	2016.02.18
1180	[문의] Web RStudio안에서 R 패키지 설치관련 [1]	보석	2016.02.19
1179	서버를 어디에 선택하는 것이 좋을까요? [2]	osr33260216	2016.02.19
1178	왜 국가통계포털의 자료가 ggplot갤러리에 자료 업로드가 않되죠? [2]	osr33260216	2016.02.19
1177	Web R studio 초기화방법 문의드립니다. [4]	화모기	2016.02.21
1176	안녕하세요 r 구조방정식 질문이 있습니다 [6]	마술샘	2016.02.23
1175	위성지도를 그래프로 그렸는데 이것을 그림지도로 바꿀려면 어떻게 해야하죠? [1]	osr33260216	2016.02.23

Write Tag

First Page 1 2 3 4 5 6 7 8 9 10 Last Page

로지스틱 회귀분석에 관하여 질문드립니다.

Comment 2

cardiomoon

tympa