Skip to menu

안녕하세요.. 다중 회귀 관련 자료를 찾다가 여기에서 많은 도움을 받았습니다. 감사합니다 ㅜㅜ


다름이 아니라 여기 선생님들께 여쭈어 볼 것이 있습니다. (저는 R method 를 이용합니다. )


Q1.  단순 회귀, 다중 회귀 상관없이 종속변수가 순서 없는 2가지 클래스로 분류되는 범주형 자료일때 아래와 같이 binomial 을 추가하는 것으로 알고 있습니다. 


Q1-1) 이때 설명변수에 관해서 질문이 있습니다. 아래의 자료 같은 경우에 보면 성별은 0,1 로 이루어진 범주형 자료인데, 이것에 factor를 취하지 않고 그냥 분석에 이용합니다. 0,1의 두가지 class로 이뤄진 자료같은 경우에는 factor로 변환하지 않아도 상관없는 것인가요? 


[출처 : http://web-r.org/qna/16319#comment_16366 의 cardiomoon 님 답변 ]

require(survival)
Loading required package: survival

colon<-na.omit(colon)
result=glm(status~rx+sex+age+obstruct+perfor,family=binomial,data=colon)
summary(result)

Q1-2)   아래의 데이터 구성처럼 종속 변수로 유전자 발현값도 사용해 보려고 합니다. 


종속변수 : 0/1 로 구성된 범주형 자료

설명변수-1: 유전자 A의 발현값 

설명변수-2:  유전자 B의 발현값

설명변수-3: 성별


glm(status~유전자A발현값+ 유전자B발현값+성별,family=binomial,data=colon) 의 식으로 regression을 진행하는 것이 맞나요? 

(종속변수가 범주형 자료이기 때문에 binomial option을 넣었고,  유전자 값들은 연속형 자료이기 때문에 factor로 변환하지 않았습니다. )


Q2. 종속 변수에 영향을 미치는 요인들을 알고 싶을때 분석하는 방법


http://web-r.org/qna/15387#comment_15395 글을 보니까 우선 단변량 분석을 통해서 낮은 p 값을 가지는 종속변수들을 골라내고, 그들중 p value가 낮은 것만을 뽑아서 다변량 분석에 이용하는것 같고, 그 이후에 step 함수를 이용하여 중요한 요인들을 골라내는 것 같습니다.   


제가 설명한것처럼 분석을 진행해도 통계적으로 문제가 없는 것인가요? 


또, 이 방법에 관련해서 공부를 더 해보고 싶은데요. 웹에서 하는 R 통계 홈페이지에도 이것에 관한 설명이 나와있나요? 단순 검색으로 찾았을때는 나오지 않아서 여기에 여쭤봅니다 ㅜㅜ 


정말 정말 감사드립니다. 

No. Subject Author Date
1093 Box plot 그리프 설정에 관해 문의합니다. papahong 2022.06.20
1092 cluster data 의 risk difference 에 대해 여쭙고자 합니다. lagrima 2022.06.19
1091 Pair plot을 할 경우 [1] PipeDragoN 2022.06.13
1090 PSM에서 matching 버튼 위치 문의 통계어려워 2022.06.13
1089 PSM (4그룹) 관련 문의드립니다. emksh77 2022.06.08
1088 정회원후원하였습니다. [1] secret rosemary 2022.06.08
1087 PSM 문의 [2] secret sfumatoi 2022.06.07
1086 multipleROC 패키지에서 multivariable의 cutoff 구하기 file 찬쓰 2022.06.07
1085 survival analysis관련 문의 드립니다 [1] cebukim 2022.06.04
1084 autoReg 설치 관련 오류 [5] 닥터강 2022.05.24
1083 survival tree (RPA) 분석 관련 문의 드립니다. [2] 곰곰11 2022.05.23
1082 통계 질문입니다. [1] file 봄봄봄 2022.05.23
1081 데이터 불러오기 문제 [3] strat 2022.04.25
1080 r프로그래밍 문자는 factor로 읽을 수 없나요? [1] file 채채채추ㅐㅊ채야채 2022.04.21
1079 R 코드와 관련하여 문의 드려도 될까요..? [5] file 꾸이뭉 2022.04.19
1078 R 업데이트 후 mytable 함수 에러가 있습니다. [1] 카이토르 2022.04.18
1077 Survival curve 에서 cumulative incidence % 로 표현 가능할까요 [1] nyknicks 2022.04.16
1076 multiple logistic regression test에서 설명변수 선택에 대해 여쭙습니다. [2] file kms9057 2022.04.16
1075 PSM 문의 드립니다 [1] caesar 2022.04.07
1074 Survival regression에서 Survival probability 그래프에서 회색음영이 무엇인지요? [2] file 케로스 2022.03.24