Skip to menu

안녕하세요, 

R 배우고 있는 학생입니다.. 

 

다름이 아니고

로지스틱 회귀분석을 돌렸는데

아래와 같이 변수명이 아닌, 변수값들이 우르르 떠서...

혹시 원인을 알 수 있을까요...??

확인 부탁 드립니다..ㅠ.ㅠ

 

+ 추가로  y 값들은 반드시 0 이상 1 이하이어야 합니다 >> 이 부분은 어떻게 해결하면 좋을까요..?

 

이유가 뭘까요.PNG

 

 

>> 코드값

 

data <- read.csv(file = file.choose())

str(data)

 

table(is.na(data))

colnames(data)

 

data <- data[, -c(1,2,6,10,17,18)]

colnames(data)

table(is.na(data))

 

table(is.na(data$YM))

table(is.na(data$GENDER))

table(is.na(data$SCTR_CD))

table(is.na(data$LN_CD_1))

table(is.na(data$LN_CD_2))

table(is.na(data$LN_AMT))

table(is.na(data$LAST_LOAN_CNT))

table(is.na(data$LAST_LOAN_AMT))

table(is.na(data$LAST_LOAN_CNT_2ND))

table(is.na(data$LAST_LOAN_AMT_2ND))

table(is.na(data$MM_CARD))

table(is.na(data$BAD_YN))

 

colnames(data)

data <- data[, -c(11)]

 

colnames(data)

table(is.na(data)) #결측치 없음 확인

 

table(data$BAD_YN)

install.packages("sampling")

library(sampling)

 

stratified_sampling <- strata(data, stratanames = c("BAD_YN"), size =c(286,286),

                              method="srswor")

 

st_data <- getdata(data, stratified_sampling)

table(st_data$BAD_YN)

 

library(caret)

train <- createDataPartition(st_data$ID, p=0.7, list=FALSE)

 

td <- st_data[train,]

vd <- st_data[-train,]

 

colnames(td)

td <- td[, -c(12,13,14)]

vd <- vd[, -c(12,13,14)]

 

colnames(td)

 

str(td)

 

td$GENDER <- as.factor(td$GENDER)

td$SCTR_CD <- as.factor(td$SCTR_CD)

td$LN_CD_1 <- as.factor(td$LN_CD_1)

td$LN_CD_2 <- as.factor(td$LN_CD_2)

td$BAD_YN <- as.numeric(td$BAD_YN)

td$BAD_YN[td$BAD_YN == 'Y'] <- 1

td$BAD_YN[td$BAD_YN == 'N'] <- 0

 

vd$GENDER <- as.factor(vd$GENDER)

vd$SCTR_CD <- as.factor(vd$SCTR_CD)

vd$LN_CD_1 <- as.factor(vd$LN_CD_1)

vd$LN_CD_2 <- as.factor(vd$LN_CD_2)

vd$BAD_YN <- as.factor(vd$BAD_YN)

vd$BAD_YN <- as.numeric(vd$BAD_YN)

vd$BAD_YN[vd$BAD_YN == 'Y'] <- 1

vd$BAD_YN[vd$BAD_YN == 'N'] <- 0

 

str(td)

# 로지스틱 회귀분석

model <- glm(BAD_YN ~., data=td, family=binomial)

summary(model)

No. Subject Author Date
1194 상호작용효과를 폴리곤 그래프로 만들 때 오류 [3] file 반디12 2016.01.12
1193 생존분석에서 Status 선택 에러 [2] file 규리맘 2016.01.14
1192 ROC 커브에 관련된 글을 읽고 R로 따라하다가 질문드립니다. [5] Victo 2016.01.15
1191 Console 에 관한 질문입니다. [2] R까기 2016.01.15
1190 ROC 커브에 대한 다른 질문입니다. [1] file Victo 2016.01.15
1189 ggrm 에러 [1] 규리맘 2016.01.20
1188 standard error 에 관한 질문입니다. [6] R까기 2016.01.28
1187 성향점수 맞추기에서 질문드립니다. [5] hawk1227 2016.01.30
1186 클리블랜드 점그래프 그리기 오류 관련 [5] Mefirst~! 2016.02.09
1185 두 검사법끼리의 비교는 어떤 통계를 이용해야 할까요? [1] 피터팬79 2016.02.14
1184 생존분석 관련 질문입니다 [1] 크론벤 2016.02.17
1183 R초보이자 Web-R 초보로서 기본적 질문 몇가지를 여쭙습니다. [1] 보석 2016.02.17
1182 웹에서 클릭만으로 하는 R통계분석에서 궁금한점 [2] osr33260216 2016.02.18
1181 웹에서 클릭만으로 하는 R통계 [2] file osr33260216 2016.02.18
1180 [문의] Web RStudio안에서 R 패키지 설치관련 [1] 보석 2016.02.19
1179 서버를 어디에 선택하는 것이 좋을까요? [2] file osr33260216 2016.02.19
1178 왜 국가통계포털의 자료가 ggplot갤러리에 자료 업로드가 않되죠? [2] file osr33260216 2016.02.19
1177 Web R studio 초기화방법 문의드립니다. [4] secret 화모기 2016.02.21
1176 안녕하세요 r 구조방정식 질문이 있습니다 [6] 마술샘 2016.02.23
1175 위성지도를 그래프로 그렸는데 이것을 그림지도로 바꿀려면 어떻게 해야하죠? [1] file osr33260216 2016.02.23