지금 머신러닝 공부를 하는데 결과가 이상하게 나와서 한번만 봐주실 수 있을까요??ㅠㅠ
나이브 베이즈 분류기로 댓글의 긍정 부정을 판별하려는데 클래스 불균형이 심각하면 그게 결과에 많이 영향을 미치나요?
만일 긍정과 부정이 9:1인 train데이터를 가지고 모델을 만들고 test데이터에 대해 prediction하는 경우에 컴퓨터는 무조건 긍정으로 판별하여
그 결과의 정확도가 test데이터의 부정label 갯수만큼 떨어지는것인지 궁금합니다.
제가 만든 데이터셋과 R script파일을 첨부합니다.. 제발 한번만 봐주세요ㅠㅠ
Comment 1
-
cardiomoon
2018.06.05 08:57
No. | Subject | Author | Date |
---|---|---|---|
1254 | 생존분석 [1] | toby | 2015.04.29 |
1253 | RStudio v0.99 Preview: Code Diagnostics [1] | fermat39 | 2015.04.30 |
1252 | Rstudio 사용법` [3] | 방랑자 | 2015.05.02 |
1251 | need finite 'xlim' values [3] | anthleemd | 2015.05.02 |
1250 | 샤이니 앱에서 SQL 명령어 사용 방법 [2] | 김브링이 | 2015.05.06 |
1249 | 표만들기 관련 [2] | 현승협 | 2015.05.07 |
1248 | MS word문서 저장관련 [1] | 아자 | 2015.05.09 |
1247 | R서버 설치 문의드립니다. [4] | 화모기 | 2015.05.13 |
1246 | 웹에서 하는 R통계 - R코드 [2] | 김영진 | 2015.06.07 |
1245 | Plot inset 만들기 | cardiomoon | 2015.06.09 |
1244 | 오류 질문 - 표작성시 [1] | 미소천사 | 2015.06.15 |
1243 | 오류 질문 - PDF 변환 안되는 file입니다. [1] | 미소천사 | 2015.06.15 |
1242 | print ztable [1] | 김영진 | 2015.06.17 |
1241 | 표 작성시 질문 [1] | simsim | 2015.06.17 |
1240 | 나무 분석 질문입니다. | 미소천사 | 2015.06.19 |
1239 | Interactive ggplot2 [2] | cardiomoon | 2015.06.22 |
1238 | Rstudio server 서버 오류 관련해서 문의드립니다. [2] | 노상래 | 2015.07.22 |
1237 | Rstudio server 무한 로딩 관련해서 문의 드립니다. [6] | 노상래 | 2015.07.24 |
1236 | http://www.r-statistics.com/ 번역소식 [1] | fermat39 | 2015.07.25 |
1235 | 생존분석 변수선택 [3] | nash | 2015.08.11 |
코드를 살펴보았는데 별 문제 없어보입니다.
그런데 질문을 이해 못하겠는데요. 전체 데이터의 긍정과 부정이 약 9:1인 데이터를 가지고 7:3으로 training set와 test set로 나누어 모델을 만들고 test데이터에 대해 prediction하는 경우에 약 9:1로 나올 것으로 예상됩니다. 코드의 결과도 약 9:1로 나오는데요?