Skip to menu

안녕하세요.. 다중 회귀 관련 자료를 찾다가 여기에서 많은 도움을 받았습니다. 감사합니다 ㅜㅜ


다름이 아니라 여기 선생님들께 여쭈어 볼 것이 있습니다. (저는 R method 를 이용합니다. )


Q1.  단순 회귀, 다중 회귀 상관없이 종속변수가 순서 없는 2가지 클래스로 분류되는 범주형 자료일때 아래와 같이 binomial 을 추가하는 것으로 알고 있습니다. 


Q1-1) 이때 설명변수에 관해서 질문이 있습니다. 아래의 자료 같은 경우에 보면 성별은 0,1 로 이루어진 범주형 자료인데, 이것에 factor를 취하지 않고 그냥 분석에 이용합니다. 0,1의 두가지 class로 이뤄진 자료같은 경우에는 factor로 변환하지 않아도 상관없는 것인가요? 


[출처 : http://web-r.org/qna/16319#comment_16366 의 cardiomoon 님 답변 ]

require(survival)
Loading required package: survival

colon<-na.omit(colon)
result=glm(status~rx+sex+age+obstruct+perfor,family=binomial,data=colon)
summary(result)

Q1-2)   아래의 데이터 구성처럼 종속 변수로 유전자 발현값도 사용해 보려고 합니다. 


종속변수 : 0/1 로 구성된 범주형 자료

설명변수-1: 유전자 A의 발현값 

설명변수-2:  유전자 B의 발현값

설명변수-3: 성별


glm(status~유전자A발현값+ 유전자B발현값+성별,family=binomial,data=colon) 의 식으로 regression을 진행하는 것이 맞나요? 

(종속변수가 범주형 자료이기 때문에 binomial option을 넣었고,  유전자 값들은 연속형 자료이기 때문에 factor로 변환하지 않았습니다. )


Q2. 종속 변수에 영향을 미치는 요인들을 알고 싶을때 분석하는 방법


http://web-r.org/qna/15387#comment_15395 글을 보니까 우선 단변량 분석을 통해서 낮은 p 값을 가지는 종속변수들을 골라내고, 그들중 p value가 낮은 것만을 뽑아서 다변량 분석에 이용하는것 같고, 그 이후에 step 함수를 이용하여 중요한 요인들을 골라내는 것 같습니다.   


제가 설명한것처럼 분석을 진행해도 통계적으로 문제가 없는 것인가요? 


또, 이 방법에 관련해서 공부를 더 해보고 싶은데요. 웹에서 하는 R 통계 홈페이지에도 이것에 관한 설명이 나와있나요? 단순 검색으로 찾았을때는 나오지 않아서 여기에 여쭤봅니다 ㅜㅜ 


정말 정말 감사드립니다. 

No. Subject Author Date
1074 Survival regression에서 Survival probability 그래프에서 회색음영이 무엇인지요? [2] file 케로스 2022.03.24
1073 Bonferroni's adjustment 관련 문의드립니다. [1] kjptrn 2022.03.23
1072 파일 업로드 문의드립니다. [1] ulysses11 2022.03.07
1071 x 축 변수가 어려개인 그래프를 그릴 수 있을까요? [1] 나현둥 2022.02.20
1070 독립변수가 이상한 (?) 경우의 로지스틱 회귀분석 [4] papahong 2022.02.20
1069 survival tree 분석을 하였는데 node가 한 개만 나옵니다 [1] 뒤통수조심 2022.02.10
1068 예후예측 점수 만든후 그것으로 survival 예측하는 데에 문제 겪고있습니다. [1] 권혜미 2022.02.08
1067 기초적인 통계에서 평균, 중간값, 최빈값에 대한 질문입니다. 우엉우왕 2022.02.04
1066 메타분석 plot 출력 문제와 관련해 답변해 주신 내용에 따라 다시 글을 올립니다. [2] secret endostat 2022.01.27
1065 메타분석 후 plot을 다운로드했을 때 일부 plot이 나오지 않습니다. [1] endostat 2022.01.27
1064 에러가 났는데 어떻게 해야 하나요? [1] 세렌 2022.01.21
1063 multipleROC package 질문 [2] 구현아빠 2022.01.13
1062 교수님, 맥에서 R studio 설치해서 엑셀을 불러오는데 어려움이 있습니다. [1] hslee0511 2022.01.12
1061 multiple imputation 에 관한 질문 [2] 열공빡공 2022.01.08
1060 혹시 median, IQR은 확인할수없나요? [1] ulysses11 2022.01.07
1059 Survival outcome 예측하는 모델 비교 [2] mjsong8705 2022.01.06
1058 출간오류에 대해 문의드립니다. file 구오 2021.12.27
1057 데이터 업로드 오류 [1] 보라도리 2021.12.27
1056 안녕하십니까, ROC curve AUC값 비교 (single predictors, regression models)에 대해서 여쭙습니다. [2] kjg 2021.12.25
1055 ggplot2에서 p값구하기문의 [2] MCB 2021.12.14