Skip to menu

안녕하세요.. 다중 회귀 관련 자료를 찾다가 여기에서 많은 도움을 받았습니다. 감사합니다 ㅜㅜ


다름이 아니라 여기 선생님들께 여쭈어 볼 것이 있습니다. (저는 R method 를 이용합니다. )


Q1.  단순 회귀, 다중 회귀 상관없이 종속변수가 순서 없는 2가지 클래스로 분류되는 범주형 자료일때 아래와 같이 binomial 을 추가하는 것으로 알고 있습니다. 


Q1-1) 이때 설명변수에 관해서 질문이 있습니다. 아래의 자료 같은 경우에 보면 성별은 0,1 로 이루어진 범주형 자료인데, 이것에 factor를 취하지 않고 그냥 분석에 이용합니다. 0,1의 두가지 class로 이뤄진 자료같은 경우에는 factor로 변환하지 않아도 상관없는 것인가요? 


[출처 : http://web-r.org/qna/16319#comment_16366 의 cardiomoon 님 답변 ]

require(survival)
Loading required package: survival

colon<-na.omit(colon)
result=glm(status~rx+sex+age+obstruct+perfor,family=binomial,data=colon)
summary(result)

Q1-2)   아래의 데이터 구성처럼 종속 변수로 유전자 발현값도 사용해 보려고 합니다. 


종속변수 : 0/1 로 구성된 범주형 자료

설명변수-1: 유전자 A의 발현값 

설명변수-2:  유전자 B의 발현값

설명변수-3: 성별


glm(status~유전자A발현값+ 유전자B발현값+성별,family=binomial,data=colon) 의 식으로 regression을 진행하는 것이 맞나요? 

(종속변수가 범주형 자료이기 때문에 binomial option을 넣었고,  유전자 값들은 연속형 자료이기 때문에 factor로 변환하지 않았습니다. )


Q2. 종속 변수에 영향을 미치는 요인들을 알고 싶을때 분석하는 방법


http://web-r.org/qna/15387#comment_15395 글을 보니까 우선 단변량 분석을 통해서 낮은 p 값을 가지는 종속변수들을 골라내고, 그들중 p value가 낮은 것만을 뽑아서 다변량 분석에 이용하는것 같고, 그 이후에 step 함수를 이용하여 중요한 요인들을 골라내는 것 같습니다.   


제가 설명한것처럼 분석을 진행해도 통계적으로 문제가 없는 것인가요? 


또, 이 방법에 관련해서 공부를 더 해보고 싶은데요. 웹에서 하는 R 통계 홈페이지에도 이것에 관한 설명이 나와있나요? 단순 검색으로 찾았을때는 나오지 않아서 여기에 여쭤봅니다 ㅜㅜ 


정말 정말 감사드립니다. 

No. Subject Author Date
1113 ROC 비교 관하여 질문드립니다!(delong's test) 나현둥 2022.08.09
1112 안녕하세요교수님! VIF 관련하여 질문드립니다. file kms9057 2022.08.08
1111 cox 에서 AIC모델 구하는 방법이 있나요? [1] 쥬쥬즈주 2022.08.03
1110 PSM 중 server disconnected [3] joonho 2022.08.01
1109 서로 다른 set 에서의 kappa 값 비교 papahong 2022.07.30
1108 PSM에 대하여 [1] 김습습 2022.07.29
1107 엑셀의 index 기능을 R 에서 구현하려고 합니다 file emilien 2022.07.28
1106 survival 분석 중 PPT 다운로드 오류 secret 곰곰11 2022.07.26
1105 결과 ppt 다운로드 중 오류발생문제 [2] 곰곰11 2022.07.25
1104 Control/experimental Group이 있을 때 유의미한 결과 도출 방법 [3] 민됴 2022.07.25
1103 Cox uni multivaraite [2] zsdfa 2022.07.14
1102 생존분석 문의드립니다 [1] 최홍재 2022.07.13
1101 인용 관련하여 [1] kms9057 2022.07.12
1100 메타 회귀 분석 시 ggplot 출력에 관해 문의드립니다. endostat 2022.07.09
1099 생존곡선에서 색깔 변화 문의드립니다. file 케로스 2022.07.09
1098 후향적 임상시험에서의 검체수 산정 방법 질문 라라보라 2022.07.05
1097 Kaplan Meier survival curve 질문입니다 [2] cetla 2022.07.03
1096 mytalbe( )패키지 사용중 문의드립니다. 하은 2022.07.02
1095 심평원 R studio 내 lubridate 설치 오류 [4] 꾸이뭉 2022.06.27
1094 안녕하세요 r 코드 중에 도저히 해결이 안나는 문제가 있어서 여기에 문의 드립니다 [1] file 슈퍼맨 2022.06.24