Skip to menu

안녕하세요, 

R 배우고 있는 학생입니다.. 

 

다름이 아니고

로지스틱 회귀분석을 돌렸는데

아래와 같이 변수명이 아닌, 변수값들이 우르르 떠서...

혹시 원인을 알 수 있을까요...??

확인 부탁 드립니다..ㅠ.ㅠ

 

+ 추가로  y 값들은 반드시 0 이상 1 이하이어야 합니다 >> 이 부분은 어떻게 해결하면 좋을까요..?

 

이유가 뭘까요.PNG

 

 

>> 코드값

 

data <- read.csv(file = file.choose())

str(data)

 

table(is.na(data))

colnames(data)

 

data <- data[, -c(1,2,6,10,17,18)]

colnames(data)

table(is.na(data))

 

table(is.na(data$YM))

table(is.na(data$GENDER))

table(is.na(data$SCTR_CD))

table(is.na(data$LN_CD_1))

table(is.na(data$LN_CD_2))

table(is.na(data$LN_AMT))

table(is.na(data$LAST_LOAN_CNT))

table(is.na(data$LAST_LOAN_AMT))

table(is.na(data$LAST_LOAN_CNT_2ND))

table(is.na(data$LAST_LOAN_AMT_2ND))

table(is.na(data$MM_CARD))

table(is.na(data$BAD_YN))

 

colnames(data)

data <- data[, -c(11)]

 

colnames(data)

table(is.na(data)) #결측치 없음 확인

 

table(data$BAD_YN)

install.packages("sampling")

library(sampling)

 

stratified_sampling <- strata(data, stratanames = c("BAD_YN"), size =c(286,286),

                              method="srswor")

 

st_data <- getdata(data, stratified_sampling)

table(st_data$BAD_YN)

 

library(caret)

train <- createDataPartition(st_data$ID, p=0.7, list=FALSE)

 

td <- st_data[train,]

vd <- st_data[-train,]

 

colnames(td)

td <- td[, -c(12,13,14)]

vd <- vd[, -c(12,13,14)]

 

colnames(td)

 

str(td)

 

td$GENDER <- as.factor(td$GENDER)

td$SCTR_CD <- as.factor(td$SCTR_CD)

td$LN_CD_1 <- as.factor(td$LN_CD_1)

td$LN_CD_2 <- as.factor(td$LN_CD_2)

td$BAD_YN <- as.numeric(td$BAD_YN)

td$BAD_YN[td$BAD_YN == 'Y'] <- 1

td$BAD_YN[td$BAD_YN == 'N'] <- 0

 

vd$GENDER <- as.factor(vd$GENDER)

vd$SCTR_CD <- as.factor(vd$SCTR_CD)

vd$LN_CD_1 <- as.factor(vd$LN_CD_1)

vd$LN_CD_2 <- as.factor(vd$LN_CD_2)

vd$BAD_YN <- as.factor(vd$BAD_YN)

vd$BAD_YN <- as.numeric(vd$BAD_YN)

vd$BAD_YN[vd$BAD_YN == 'Y'] <- 1

vd$BAD_YN[vd$BAD_YN == 'N'] <- 0

 

str(td)

# 로지스틱 회귀분석

model <- glm(BAD_YN ~., data=td, family=binomial)

summary(model)

No. Subject Author Date
» 로지스틱 회귀분석 결과 변수가 이렇게 뜨는 이유 알 수 있을까요? [1] file r룰루 2021.08.09
1053 ztable 결과가 출력이 되지 않는 문제에 대해 질문드립니다. [2] zepiros15 2019.10.11
1052 ROC 커브 질문드립니다. [4] kaiross 2016.08.25
1051 propensity score matching과 mytable... 카이토르 2020.01.08
1050 mytable을 가지고 ztable시, ztable의 caption, align 등 이 작동을 하지 않습니다. file 김찬식 2020.11.30
1049 R을 이용한 조건부 과정 분석 _model1 질문드립니다.(그림추가) file chrik 2021.04.10
1048 need finite 'xlim' values [3] anthleemd 2015.05.02
1047 교수님 문의 드리겠습니다. 세희맘 2019.09.30
1046 로지스틱 회귀 분석에서 반응(종속)변수에 결측치 [1] hawk1227 2016.04.07
1045 Scatter plot 에서 P-value 표현 방법 문의 [1] 모노코로 2020.10.22
1044 ggAncova vs ggeffect 차이를 알려주세요 [3] 권혜미 2017.03.10
1043 건강 두뇌 몸에 좋은 좋은글 한번씩 읽고들가세요 ^^ 송유나 2018.06.16
1042 R에서 자동 조합 생성 가능한가요? [2] kenny 2018.01.30
1041 로지스틱 회기분석 에러 [2] file arranger 2016.01.09
1040 정회원 등록부탁드립니다 [1] mhh 2021.02.02
1039 통계 초보가 효과 크기에 대해 질문드립니다. 상냥한펭귄씨 2018.10.01
1038 web-r의 ggplot2를 사용해 보고 [2] 장미공원 2017.02.07
1037 책 관련 문의드립니다 [1] IMG마리 2020.06.10
1036 두 검사법끼리의 비교는 어떤 통계를 이용해야 할까요? [1] 피터팬79 2016.02.14
1035 정규성 검정에 대해서 여쭤봅니다. [2] file R까기 2016.04.22