Skip to menu

안녕하세요, 

R 배우고 있는 학생입니다.. 

 

다름이 아니고

로지스틱 회귀분석을 돌렸는데

아래와 같이 변수명이 아닌, 변수값들이 우르르 떠서...

혹시 원인을 알 수 있을까요...??

확인 부탁 드립니다..ㅠ.ㅠ

 

+ 추가로  y 값들은 반드시 0 이상 1 이하이어야 합니다 >> 이 부분은 어떻게 해결하면 좋을까요..?

 

이유가 뭘까요.PNG

 

 

>> 코드값

 

data <- read.csv(file = file.choose())

str(data)

 

table(is.na(data))

colnames(data)

 

data <- data[, -c(1,2,6,10,17,18)]

colnames(data)

table(is.na(data))

 

table(is.na(data$YM))

table(is.na(data$GENDER))

table(is.na(data$SCTR_CD))

table(is.na(data$LN_CD_1))

table(is.na(data$LN_CD_2))

table(is.na(data$LN_AMT))

table(is.na(data$LAST_LOAN_CNT))

table(is.na(data$LAST_LOAN_AMT))

table(is.na(data$LAST_LOAN_CNT_2ND))

table(is.na(data$LAST_LOAN_AMT_2ND))

table(is.na(data$MM_CARD))

table(is.na(data$BAD_YN))

 

colnames(data)

data <- data[, -c(11)]

 

colnames(data)

table(is.na(data)) #결측치 없음 확인

 

table(data$BAD_YN)

install.packages("sampling")

library(sampling)

 

stratified_sampling <- strata(data, stratanames = c("BAD_YN"), size =c(286,286),

                              method="srswor")

 

st_data <- getdata(data, stratified_sampling)

table(st_data$BAD_YN)

 

library(caret)

train <- createDataPartition(st_data$ID, p=0.7, list=FALSE)

 

td <- st_data[train,]

vd <- st_data[-train,]

 

colnames(td)

td <- td[, -c(12,13,14)]

vd <- vd[, -c(12,13,14)]

 

colnames(td)

 

str(td)

 

td$GENDER <- as.factor(td$GENDER)

td$SCTR_CD <- as.factor(td$SCTR_CD)

td$LN_CD_1 <- as.factor(td$LN_CD_1)

td$LN_CD_2 <- as.factor(td$LN_CD_2)

td$BAD_YN <- as.numeric(td$BAD_YN)

td$BAD_YN[td$BAD_YN == 'Y'] <- 1

td$BAD_YN[td$BAD_YN == 'N'] <- 0

 

vd$GENDER <- as.factor(vd$GENDER)

vd$SCTR_CD <- as.factor(vd$SCTR_CD)

vd$LN_CD_1 <- as.factor(vd$LN_CD_1)

vd$LN_CD_2 <- as.factor(vd$LN_CD_2)

vd$BAD_YN <- as.factor(vd$BAD_YN)

vd$BAD_YN <- as.numeric(vd$BAD_YN)

vd$BAD_YN[vd$BAD_YN == 'Y'] <- 1

vd$BAD_YN[vd$BAD_YN == 'N'] <- 0

 

str(td)

# 로지스틱 회귀분석

model <- glm(BAD_YN ~., data=td, family=binomial)

summary(model)

No. Subject Author Date
1234 교수님 안녕하세요 moonbook 패키지 mycsv 오류가 나서 문의드립니다. [1] holyhyun 2022.11.15
1233 로지스틱회귀분석 in R [3] wjdEoddl 2018.01.19
1232 출판편향 오류 [2] file 알로하 2018.04.19
1231 Enter calculcation equation을 넣는 형식 신희순 2018.10.04
1230 R통계와 그래프공부하다가 궁금점 [3] KCRS_LeeJM 2017.02.09
1229 특정 조건을 만족하는 ROW 삭제에 관한 질문입니다! [1] file ksyjudy 2017.07.30
1228 [정보] 구조방정식 모형 분석 관련 참고자료 소개 [2] 보석 2016.02.24
1227 교수님 문의드립니다~ [5] chamchi 2017.01.22
1226 data 업로드시 연속형변수 인식오류 [1] 밤쿤 2020.04.21
1225 틀리지 않는법 [1] file cardiomoon 2017.11.29
1224 PPT 다운로드 [2] hsshin 2018.12.20
1223 ztable 한글깨짐에 대해 문의드립니다. 오규한 2020.08.20
1222 통계 기초적인 질문입니다. [2] R까기 2016.01.12
1221 data frame 문의드립니다. [1] hichoi 2018.04.25
1220 안녕하세요? mytable에서 나온 결과를 워드 저장하는 방법에 대해 문의드립니다. [2] 박만영 2018.03.12
1219 자꾸 disconnected from the server가 뜹니다. [1] clairekim_ 2020.11.10
1218 안녕하세요. K-M 곡선에서 censored mark에 대해서 문의드립니다. 간간해요 2019.01.14
1217 콘솔창 실행결과가 출력되지않음. (RStudio) [1] wjdEoddl 2019.06.04
1216 error 문의드립니다. [1] chamchi 2017.07.19
1215 안녕하세요 공부하던 중 질문드립니다. [1] Ikarus86 2018.05.27