Skip to menu

안녕하세요.. 다중 회귀 관련 자료를 찾다가 여기에서 많은 도움을 받았습니다. 감사합니다 ㅜㅜ


다름이 아니라 여기 선생님들께 여쭈어 볼 것이 있습니다. (저는 R method 를 이용합니다. )


Q1.  단순 회귀, 다중 회귀 상관없이 종속변수가 순서 없는 2가지 클래스로 분류되는 범주형 자료일때 아래와 같이 binomial 을 추가하는 것으로 알고 있습니다. 


Q1-1) 이때 설명변수에 관해서 질문이 있습니다. 아래의 자료 같은 경우에 보면 성별은 0,1 로 이루어진 범주형 자료인데, 이것에 factor를 취하지 않고 그냥 분석에 이용합니다. 0,1의 두가지 class로 이뤄진 자료같은 경우에는 factor로 변환하지 않아도 상관없는 것인가요? 


[출처 : http://web-r.org/qna/16319#comment_16366 의 cardiomoon 님 답변 ]

require(survival)
Loading required package: survival

colon<-na.omit(colon)
result=glm(status~rx+sex+age+obstruct+perfor,family=binomial,data=colon)
summary(result)

Q1-2)   아래의 데이터 구성처럼 종속 변수로 유전자 발현값도 사용해 보려고 합니다. 


종속변수 : 0/1 로 구성된 범주형 자료

설명변수-1: 유전자 A의 발현값 

설명변수-2:  유전자 B의 발현값

설명변수-3: 성별


glm(status~유전자A발현값+ 유전자B발현값+성별,family=binomial,data=colon) 의 식으로 regression을 진행하는 것이 맞나요? 

(종속변수가 범주형 자료이기 때문에 binomial option을 넣었고,  유전자 값들은 연속형 자료이기 때문에 factor로 변환하지 않았습니다. )


Q2. 종속 변수에 영향을 미치는 요인들을 알고 싶을때 분석하는 방법


http://web-r.org/qna/15387#comment_15395 글을 보니까 우선 단변량 분석을 통해서 낮은 p 값을 가지는 종속변수들을 골라내고, 그들중 p value가 낮은 것만을 뽑아서 다변량 분석에 이용하는것 같고, 그 이후에 step 함수를 이용하여 중요한 요인들을 골라내는 것 같습니다.   


제가 설명한것처럼 분석을 진행해도 통계적으로 문제가 없는 것인가요? 


또, 이 방법에 관련해서 공부를 더 해보고 싶은데요. 웹에서 하는 R 통계 홈페이지에도 이것에 관한 설명이 나와있나요? 단순 검색으로 찾았을때는 나오지 않아서 여기에 여쭤봅니다 ㅜㅜ 


정말 정말 감사드립니다. 

No. Subject Author Date
1114 regression 시행하려고 하면 에러가 뜹니다. [2] caesar 2022.08.10
1113 ROC 비교 관하여 질문드립니다!(delong's test) 나현둥 2022.08.09
1112 안녕하세요교수님! VIF 관련하여 질문드립니다. file kms9057 2022.08.08
1111 cox 에서 AIC모델 구하는 방법이 있나요? [1] 쥬쥬즈주 2022.08.03
1110 PSM 중 server disconnected [3] joonho 2022.08.01
1109 서로 다른 set 에서의 kappa 값 비교 papahong 2022.07.30
1108 PSM에 대하여 [1] 김습습 2022.07.29
1107 엑셀의 index 기능을 R 에서 구현하려고 합니다 file emilien 2022.07.28
1106 survival 분석 중 PPT 다운로드 오류 secret 곰곰11 2022.07.26
1105 결과 ppt 다운로드 중 오류발생문제 [2] 곰곰11 2022.07.25
1104 Control/experimental Group이 있을 때 유의미한 결과 도출 방법 [3] 민됴 2022.07.25
1103 Cox uni multivaraite [2] zsdfa 2022.07.14
1102 생존분석 문의드립니다 [1] 최홍재 2022.07.13
1101 인용 관련하여 [1] kms9057 2022.07.12
1100 메타 회귀 분석 시 ggplot 출력에 관해 문의드립니다. endostat 2022.07.09
1099 생존곡선에서 색깔 변화 문의드립니다. file 케로스 2022.07.09
1098 후향적 임상시험에서의 검체수 산정 방법 질문 라라보라 2022.07.05
1097 Kaplan Meier survival curve 질문입니다 [2] cetla 2022.07.03
1096 mytalbe( )패키지 사용중 문의드립니다. 하은 2022.07.02
1095 심평원 R studio 내 lubridate 설치 오류 [4] 꾸이뭉 2022.06.27