메뉴 건너뛰기

안녕하세요, 

R 배우고 있는 학생입니다.. 

 

다름이 아니고

로지스틱 회귀분석을 돌렸는데

아래와 같이 변수명이 아닌, 변수값들이 우르르 떠서...

혹시 원인을 알 수 있을까요...??

확인 부탁 드립니다..ㅠ.ㅠ

 

+ 추가로  y 값들은 반드시 0 이상 1 이하이어야 합니다 >> 이 부분은 어떻게 해결하면 좋을까요..?

 

이유가 뭘까요.PNG

 

 

>> 코드값

 

data <- read.csv(file = file.choose())

str(data)

 

table(is.na(data))

colnames(data)

 

data <- data[, -c(1,2,6,10,17,18)]

colnames(data)

table(is.na(data))

 

table(is.na(data$YM))

table(is.na(data$GENDER))

table(is.na(data$SCTR_CD))

table(is.na(data$LN_CD_1))

table(is.na(data$LN_CD_2))

table(is.na(data$LN_AMT))

table(is.na(data$LAST_LOAN_CNT))

table(is.na(data$LAST_LOAN_AMT))

table(is.na(data$LAST_LOAN_CNT_2ND))

table(is.na(data$LAST_LOAN_AMT_2ND))

table(is.na(data$MM_CARD))

table(is.na(data$BAD_YN))

 

colnames(data)

data <- data[, -c(11)]

 

colnames(data)

table(is.na(data)) #결측치 없음 확인

 

table(data$BAD_YN)

install.packages("sampling")

library(sampling)

 

stratified_sampling <- strata(data, stratanames = c("BAD_YN"), size =c(286,286),

                              method="srswor")

 

st_data <- getdata(data, stratified_sampling)

table(st_data$BAD_YN)

 

library(caret)

train <- createDataPartition(st_data$ID, p=0.7, list=FALSE)

 

td <- st_data[train,]

vd <- st_data[-train,]

 

colnames(td)

td <- td[, -c(12,13,14)]

vd <- vd[, -c(12,13,14)]

 

colnames(td)

 

str(td)

 

td$GENDER <- as.factor(td$GENDER)

td$SCTR_CD <- as.factor(td$SCTR_CD)

td$LN_CD_1 <- as.factor(td$LN_CD_1)

td$LN_CD_2 <- as.factor(td$LN_CD_2)

td$BAD_YN <- as.numeric(td$BAD_YN)

td$BAD_YN[td$BAD_YN == 'Y'] <- 1

td$BAD_YN[td$BAD_YN == 'N'] <- 0

 

vd$GENDER <- as.factor(vd$GENDER)

vd$SCTR_CD <- as.factor(vd$SCTR_CD)

vd$LN_CD_1 <- as.factor(vd$LN_CD_1)

vd$LN_CD_2 <- as.factor(vd$LN_CD_2)

vd$BAD_YN <- as.factor(vd$BAD_YN)

vd$BAD_YN <- as.numeric(vd$BAD_YN)

vd$BAD_YN[vd$BAD_YN == 'Y'] <- 1

vd$BAD_YN[vd$BAD_YN == 'N'] <- 0

 

str(td)

# 로지스틱 회귀분석

model <- glm(BAD_YN ~., data=td, family=binomial)

summary(model)

번호 제목 글쓴이 날짜 조회 수
1024 논문 revision 중 궁금한 점이 있어 질문합니다. [1] file 맹구모션 2021.09.12 144
1023 Paired T test 및 다중회귀 분석 문의드립니다. [1] secret ulysses11 2021.09.08 5
1022 회귀분석 문의 드립니다. [1] ulysses11 2021.09.08 117
1021 paired T test 문의드립니다. [1] ulysses11 2021.09.07 3333
1020 Web R Table 생성에서 결과가 다르게 나옵니다. [1] file 케로스 2021.09.01 24365
1019 로지스틱 회귀분석 - 에러코드 문의드립니다. secret wave 2021.08.31 2
1018 가설검증- cfa, sem [1] 통개 2021.08.30 115
1017 로지스틱 회귀분석 - 에러코드 문의드립니다. [1] wave 2021.08.30 112
1016 Odds ratio 값을 이용한 메타분석에 대해 문의드립니다. [2] endostat 2021.08.29 124
1015 mytable 연속형 변수 결과값 질문 [1] 1234 2021.08.28 162
1014 이런 그래프는 어떻게 그려야 하나요? -ggplot으로 가능한가요? file 보라도리 2021.08.27 136
1013 메타분석에서의 개별연구의 질검증 [1] 야스오 2021.08.24 363
1012 안녕하세요 구조방정식(moderated mediation)에 대한 질문들이 있습니다. [2] file 통개 2021.08.19 651
1011 아주 기초적인 질문을 드립니다. (범주형 변수로 지정) [1] shinyhill 2021.08.18 108
1010 multiple imputation 에 대해 질문이 있습니다 [1] 열공빡공 2021.08.18 132
1009 안녕하세요. 교수님 문의드립니다.! [1] 래유니 2021.08.11 79
» 로지스틱 회귀분석 결과 변수가 이렇게 뜨는 이유 알 수 있을까요? [1] file r룰루 2021.08.09 729
1007 Web-R에서 partial correlation 에 대해서 문의사항 있습니다. [1] 케로스 2021.08.04 102
1006 mytable(), mytable2()관련 질문이 드립니다. [1] file 닉네임은별명 2021.08.03 166
1005 정회원 후원하였습니다 [1] secret Eryn 2021.08.01 4