안녕하세요,
R 배우고 있는 학생입니다..
다름이 아니고
로지스틱 회귀분석을 돌렸는데
아래와 같이 변수명이 아닌, 변수값들이 우르르 떠서...
혹시 원인을 알 수 있을까요...??
확인 부탁 드립니다..ㅠ.ㅠ
+ 추가로 y 값들은 반드시 0 이상 1 이하이어야 합니다 >> 이 부분은 어떻게 해결하면 좋을까요..?
>> 코드값
data <- read.csv(file = file.choose())
str(data)
table(is.na(data))
colnames(data)
data <- data[, -c(1,2,6,10,17,18)]
colnames(data)
table(is.na(data))
table(is.na(data$YM))
table(is.na(data$GENDER))
table(is.na(data$SCTR_CD))
table(is.na(data$LN_CD_1))
table(is.na(data$LN_CD_2))
table(is.na(data$LN_AMT))
table(is.na(data$LAST_LOAN_CNT))
table(is.na(data$LAST_LOAN_AMT))
table(is.na(data$LAST_LOAN_CNT_2ND))
table(is.na(data$LAST_LOAN_AMT_2ND))
table(is.na(data$MM_CARD))
table(is.na(data$BAD_YN))
colnames(data)
data <- data[, -c(11)]
colnames(data)
table(is.na(data)) #결측치 없음 확인
table(data$BAD_YN)
install.packages("sampling")
library(sampling)
stratified_sampling <- strata(data, stratanames = c("BAD_YN"), size =c(286,286),
method="srswor")
st_data <- getdata(data, stratified_sampling)
table(st_data$BAD_YN)
library(caret)
train <- createDataPartition(st_data$ID, p=0.7, list=FALSE)
td <- st_data[train,]
vd <- st_data[-train,]
colnames(td)
td <- td[, -c(12,13,14)]
vd <- vd[, -c(12,13,14)]
colnames(td)
str(td)
td$GENDER <- as.factor(td$GENDER)
td$SCTR_CD <- as.factor(td$SCTR_CD)
td$LN_CD_1 <- as.factor(td$LN_CD_1)
td$LN_CD_2 <- as.factor(td$LN_CD_2)
td$BAD_YN <- as.numeric(td$BAD_YN)
td$BAD_YN[td$BAD_YN == 'Y'] <- 1
td$BAD_YN[td$BAD_YN == 'N'] <- 0
vd$GENDER <- as.factor(vd$GENDER)
vd$SCTR_CD <- as.factor(vd$SCTR_CD)
vd$LN_CD_1 <- as.factor(vd$LN_CD_1)
vd$LN_CD_2 <- as.factor(vd$LN_CD_2)
vd$BAD_YN <- as.factor(vd$BAD_YN)
vd$BAD_YN <- as.numeric(vd$BAD_YN)
vd$BAD_YN[vd$BAD_YN == 'Y'] <- 1
vd$BAD_YN[vd$BAD_YN == 'N'] <- 0
str(td)
# 로지스틱 회귀분석
model <- glm(BAD_YN ~., data=td, family=binomial)
summary(model)
Comment 1
-
cardiomoon
2021.08.11 09:01
No. | Subject | Author | Date |
---|---|---|---|
1234 | 요즘 아주 잘 쓰고 있습니다. [1] | 김승욱 | 2015.08.17 |
1233 | 자료 (xlsx or CSV) [2] | medi79 | 2015.08.31 |
1232 | 혹시 이런 질문 드려도 되는지 모르겠습니다. [5] | 고든 | 2015.09.07 |
1231 | RM ANOVA [2] | flocky | 2015.09.09 |
1230 | ANCOVA에 대해서 여쭤보고 싶습니다. [5] | 고든 | 2015.09.13 |
1229 | sensitivity, specificity 계산가능여부 여쭤봅니다. [2] | 곽미리 | 2015.09.16 |
1228 | 표만들기에서 질문드립니다. [3] | wiswis | 2015.09.22 |
1227 | Standard error [2] | R까기 | 2015.09.24 |
1226 | 결측값 처리와 관련하여 [3] | 화모기 | 2015.10.07 |
1225 | 표만들기_2차그룹변수로 했을 때 결과물 이상 [1] | 화모기 | 2015.10.10 |
1224 | 로지스틱 회귀분석 반응변수 수 제한 [3] | 화모기 | 2015.10.11 |
1223 | 향후 5년간 핵심 화두가 Cognitive Business가 될 것 같아 먼저 여기에 글을 올립니다. [2] | Ben | 2015.10.14 |
1222 | 파일업로드에 대해 문의드립니다. [3] | flapper | 2015.10.15 |
1221 | 스피어만 상관계수(Spearman correlation coefficient) [1] | ㅎㅎㅎ | 2015.10.15 |
1220 | PSM에 관해 문의 드립니다. [3] | sodium75 | 2015.10.19 |
1219 | ROC 분석과 관련하여 질문합니다. [1] | 송민지 | 2015.10.21 |
1218 | 파일 업로드 자체가 안되네요.. [3] | 주민호 | 2015.11.13 |
1217 | 사소한 건의사항이 있습니다. [1] | EPfunny | 2015.11.15 |
1216 | 나무분석 [3] | 조윤성 | 2015.12.02 |
1215 | 'x' and 'units' must have length > 0 에러 메세지 [4] | 빙하 | 2015.12.03 |
질문을 이해하지 못하겠습니다. 출력결과는 정상적으로 보입니다.