Skip to menu

안녕하세요, 

R 배우고 있는 학생입니다.. 

 

다름이 아니고

로지스틱 회귀분석을 돌렸는데

아래와 같이 변수명이 아닌, 변수값들이 우르르 떠서...

혹시 원인을 알 수 있을까요...??

확인 부탁 드립니다..ㅠ.ㅠ

 

+ 추가로  y 값들은 반드시 0 이상 1 이하이어야 합니다 >> 이 부분은 어떻게 해결하면 좋을까요..?

 

이유가 뭘까요.PNG

 

 

>> 코드값

 

data <- read.csv(file = file.choose())

str(data)

 

table(is.na(data))

colnames(data)

 

data <- data[, -c(1,2,6,10,17,18)]

colnames(data)

table(is.na(data))

 

table(is.na(data$YM))

table(is.na(data$GENDER))

table(is.na(data$SCTR_CD))

table(is.na(data$LN_CD_1))

table(is.na(data$LN_CD_2))

table(is.na(data$LN_AMT))

table(is.na(data$LAST_LOAN_CNT))

table(is.na(data$LAST_LOAN_AMT))

table(is.na(data$LAST_LOAN_CNT_2ND))

table(is.na(data$LAST_LOAN_AMT_2ND))

table(is.na(data$MM_CARD))

table(is.na(data$BAD_YN))

 

colnames(data)

data <- data[, -c(11)]

 

colnames(data)

table(is.na(data)) #결측치 없음 확인

 

table(data$BAD_YN)

install.packages("sampling")

library(sampling)

 

stratified_sampling <- strata(data, stratanames = c("BAD_YN"), size =c(286,286),

                              method="srswor")

 

st_data <- getdata(data, stratified_sampling)

table(st_data$BAD_YN)

 

library(caret)

train <- createDataPartition(st_data$ID, p=0.7, list=FALSE)

 

td <- st_data[train,]

vd <- st_data[-train,]

 

colnames(td)

td <- td[, -c(12,13,14)]

vd <- vd[, -c(12,13,14)]

 

colnames(td)

 

str(td)

 

td$GENDER <- as.factor(td$GENDER)

td$SCTR_CD <- as.factor(td$SCTR_CD)

td$LN_CD_1 <- as.factor(td$LN_CD_1)

td$LN_CD_2 <- as.factor(td$LN_CD_2)

td$BAD_YN <- as.numeric(td$BAD_YN)

td$BAD_YN[td$BAD_YN == 'Y'] <- 1

td$BAD_YN[td$BAD_YN == 'N'] <- 0

 

vd$GENDER <- as.factor(vd$GENDER)

vd$SCTR_CD <- as.factor(vd$SCTR_CD)

vd$LN_CD_1 <- as.factor(vd$LN_CD_1)

vd$LN_CD_2 <- as.factor(vd$LN_CD_2)

vd$BAD_YN <- as.factor(vd$BAD_YN)

vd$BAD_YN <- as.numeric(vd$BAD_YN)

vd$BAD_YN[vd$BAD_YN == 'Y'] <- 1

vd$BAD_YN[vd$BAD_YN == 'N'] <- 0

 

str(td)

# 로지스틱 회귀분석

model <- glm(BAD_YN ~., data=td, family=binomial)

summary(model)

No. Subject Author Date
1113 ROC 비교 관하여 질문드립니다!(delong's test) 나현둥 2022.08.09
1112 안녕하세요교수님! VIF 관련하여 질문드립니다. file kms9057 2022.08.08
1111 cox 에서 AIC모델 구하는 방법이 있나요? [1] 쥬쥬즈주 2022.08.03
1110 PSM 중 server disconnected [3] joonho 2022.08.01
1109 서로 다른 set 에서의 kappa 값 비교 papahong 2022.07.30
1108 PSM에 대하여 [1] 김습습 2022.07.29
1107 엑셀의 index 기능을 R 에서 구현하려고 합니다 file emilien 2022.07.28
1106 survival 분석 중 PPT 다운로드 오류 secret 곰곰11 2022.07.26
1105 결과 ppt 다운로드 중 오류발생문제 [2] 곰곰11 2022.07.25
1104 Control/experimental Group이 있을 때 유의미한 결과 도출 방법 [3] 민됴 2022.07.25
1103 Cox uni multivaraite [2] zsdfa 2022.07.14
1102 생존분석 문의드립니다 [1] 최홍재 2022.07.13
1101 인용 관련하여 [1] kms9057 2022.07.12
1100 메타 회귀 분석 시 ggplot 출력에 관해 문의드립니다. endostat 2022.07.09
1099 생존곡선에서 색깔 변화 문의드립니다. file 케로스 2022.07.09
1098 후향적 임상시험에서의 검체수 산정 방법 질문 라라보라 2022.07.05
1097 Kaplan Meier survival curve 질문입니다 [2] cetla 2022.07.03
1096 mytalbe( )패키지 사용중 문의드립니다. 하은 2022.07.02
1095 심평원 R studio 내 lubridate 설치 오류 [4] 꾸이뭉 2022.06.27
1094 안녕하세요 r 코드 중에 도저히 해결이 안나는 문제가 있어서 여기에 문의 드립니다 [1] file 슈퍼맨 2022.06.24