교수님 안녕하세요 질문이 있습니다

세발낙지 2018.06.03 20:12 Views : 1032

지금 머신러닝 공부를 하는데 결과가 이상하게 나와서 한번만 봐주실 수 있을까요??ㅠㅠ

나이브 베이즈 분류기로 댓글의 긍정 부정을 판별하려는데 클래스 불균형이 심각하면 그게 결과에 많이 영향을 미치나요?

만일 긍정과 부정이 9:1인 train데이터를 가지고 모델을 만들고 test데이터에 대해 prediction하는 경우에 컴퓨터는 무조건 긍정으로 판별하여

그 결과의 정확도가 test데이터의 부정label 갯수만큼 떨어지는것인지 궁금합니다.

제가 만든 데이터셋과 R script파일을 첨부합니다.. 제발 한번만 봐주세요ㅠㅠ

I want to

List

Comment 1

cardiomoon

2018.06.05 08:57

코드를 살펴보았는데 별 문제 없어보입니다.

그런데 질문을 이해 못하겠는데요. 전체 데이터의 긍정과 부정이 약 9:1인 데이터를 가지고 7:3으로 training set와 test set로 나누어 모델을 만들고 test데이터에 대해 prediction하는 경우에 약 9:1로 나올 것으로 예상됩니다. 코드의 결과도 약 9:1로 나오는데요?

Comment

No.	Subject	Author	Date
1214	Error in f(x, na.rm = TRUE) : 사용되지 않은 인자 (na.rm = TRUE) [2]	twogama2	2017.09.18
1213	paired T test 문의드립니다. [1]	ulysses11	2021.09.07
1212	[문의] Web RStudio안에서 R 패키지 설치관련 [1]	보석	2016.02.19
1211	Web-R 에서 logistic regression 시 p value 를 볼 수 있는 방법이 있나요? [2]	전공의	2017.08.15
1210	rstudio-server 패키지 설치오류	하리보는맛있어	2019.05.14
1209	Cut off value [2]	변변변수	2017.06.19
1208	문의드릴 사항이 있습니다. [7]	정지윤	2021.02.18
1207	mytable로 만든표를 워드파일로 변환 하는 방법 [3]	정암	2017.06.02
1206	안녕하세요 psm은 정회원만 이용 가능한가요? [1]	Arete	2020.08.01
1205	안녕하세요 mytable 함수 관련하여 질문드립니다. [1]	지옥소년	2019.07.26
1204	범주형변수와 비정규분포 연속형 변수 간 관계를 볼때 이변량 상관관계 분석이 가능한지요? [1]	아라리	2018.05.30
1203	로지스틱 회귀분석	김밥친구	2018.10.04
1202	데이타 merge 방법 [5]	nipponica	2017.02.18
1201	교수님, 다중공선성 질문드립니다. [2]	selteen	2017.11.16
1200	2 way RM ANOVA 문의드립니다.	FAdavid	2021.01.19
1199	web-r에서 psm을 수행하였는데 레퍼런스는 어떻게 표시해야 하나요? [1]	스티브	2020.11.24
1198	Rstudio server 서버 오류 관련해서 문의드립니다. [2]	노상래	2015.07.22
1197	엑셀파일 data 올릴시 maximal upload size exceeded [1]	딸기공주	2020.07.01
1196	생존분석에서 multivariate analysis에 대해 여쭙니다. [3]	joon	2016.12.23
1195	정회원용 서버가 접속이 안됩니다. [1]	마늘맨	2018.02.16

Write Tag

First Page 1 2 3 4 5 6 7 8 9 10 Last Page

교수님 안녕하세요 질문이 있습니다

Comment 1

cardiomoon