Skip to menu

안녕하세요.. 다중 회귀 관련 자료를 찾다가 여기에서 많은 도움을 받았습니다. 감사합니다 ㅜㅜ


다름이 아니라 여기 선생님들께 여쭈어 볼 것이 있습니다. (저는 R method 를 이용합니다. )


Q1.  단순 회귀, 다중 회귀 상관없이 종속변수가 순서 없는 2가지 클래스로 분류되는 범주형 자료일때 아래와 같이 binomial 을 추가하는 것으로 알고 있습니다. 


Q1-1) 이때 설명변수에 관해서 질문이 있습니다. 아래의 자료 같은 경우에 보면 성별은 0,1 로 이루어진 범주형 자료인데, 이것에 factor를 취하지 않고 그냥 분석에 이용합니다. 0,1의 두가지 class로 이뤄진 자료같은 경우에는 factor로 변환하지 않아도 상관없는 것인가요? 


[출처 : http://web-r.org/qna/16319#comment_16366 의 cardiomoon 님 답변 ]

require(survival)
Loading required package: survival

colon<-na.omit(colon)
result=glm(status~rx+sex+age+obstruct+perfor,family=binomial,data=colon)
summary(result)

Q1-2)   아래의 데이터 구성처럼 종속 변수로 유전자 발현값도 사용해 보려고 합니다. 


종속변수 : 0/1 로 구성된 범주형 자료

설명변수-1: 유전자 A의 발현값 

설명변수-2:  유전자 B의 발현값

설명변수-3: 성별


glm(status~유전자A발현값+ 유전자B발현값+성별,family=binomial,data=colon) 의 식으로 regression을 진행하는 것이 맞나요? 

(종속변수가 범주형 자료이기 때문에 binomial option을 넣었고,  유전자 값들은 연속형 자료이기 때문에 factor로 변환하지 않았습니다. )


Q2. 종속 변수에 영향을 미치는 요인들을 알고 싶을때 분석하는 방법


http://web-r.org/qna/15387#comment_15395 글을 보니까 우선 단변량 분석을 통해서 낮은 p 값을 가지는 종속변수들을 골라내고, 그들중 p value가 낮은 것만을 뽑아서 다변량 분석에 이용하는것 같고, 그 이후에 step 함수를 이용하여 중요한 요인들을 골라내는 것 같습니다.   


제가 설명한것처럼 분석을 진행해도 통계적으로 문제가 없는 것인가요? 


또, 이 방법에 관련해서 공부를 더 해보고 싶은데요. 웹에서 하는 R 통계 홈페이지에도 이것에 관한 설명이 나와있나요? 단순 검색으로 찾았을때는 나오지 않아서 여기에 여쭤봅니다 ㅜㅜ 


정말 정말 감사드립니다. 

No. Subject Author Date
1154 Multiple regression 기본 acs data로 돌려도 오류가 납니다. [3] 케로스 2023.01.22
1153 webrPSM 설치 문제 [1] hawk1227 2023.01.03
1152 정회원용서버 ExploPlots 오류 [1] 버블 2023.01.03
1151 생존분석에서 세군이상 시 사후 검정이 가능할지 여쭙습니다 [1] 정망고 2023.01.03
1150 gaze에서 show.stats Arguments가 작동하지 않습니다. [1] 김찬식 2022.12.31
1149 서버 연결이 자꾸 끊깁니다. [1] secret wave 2022.12.30
1148 PSM, full matching, cox proportional hazard model [4] file 주니 2022.12.28
1147 비밀번호 찾기 오류. [2] ezra006 2022.12.24
1146 그래프 만들던 중 오류 질문드립니다.. [1] file 헝힝헝 2022.12.14
1145 multipleROC 패키지 질문 [2] 강우성 2022.12.14
1144 웹에서 하는 R통계 (무료버전) 업로드 가능한 파일 용량이 궁금합니다. [2] 성열 2022.12.10
1143 데이터프레임 자료를 ggplot2를 이용해 꺾은선그래프 그리는 방법 [1] 다다다다빈 2022.12.06
1142 서버에서 table 만들기 에러 [1] 버블 2022.12.04
1141 mytable 문의드립니다. [1] file seyi0918 2022.11.30
1140 교수님 안녕하세요 moonbook 패키지 mycsv 오류가 나서 문의드립니다. [1] holyhyun 2022.11.15
1139 autoReg(fit, uni=TRUE)시, multivariable에 들어갈 변수들을 manual로 선택할 수 있을까요? [6] 김찬식 2022.11.14
1138 processR 패키지에서 Measurment model 정의가 가능한지요. chrik 2022.11.13
1137 Incidence rate per person-years 및 rate ratio에 대한 95% CI 산출 방법 문의 [1] file 꾸이뭉 2022.11.11
1136 서열로짓 시 평균한계효과 요다 2022.10.30
1135 서버문제로 ppt 다운로드가 안된다고 뜹니다. [5] liverim 2022.10.26