지금 머신러닝 공부를 하는데 결과가 이상하게 나와서 한번만 봐주실 수 있을까요??ㅠㅠ
나이브 베이즈 분류기로 댓글의 긍정 부정을 판별하려는데 클래스 불균형이 심각하면 그게 결과에 많이 영향을 미치나요?
만일 긍정과 부정이 9:1인 train데이터를 가지고 모델을 만들고 test데이터에 대해 prediction하는 경우에 컴퓨터는 무조건 긍정으로 판별하여
그 결과의 정확도가 test데이터의 부정label 갯수만큼 떨어지는것인지 궁금합니다.
제가 만든 데이터셋과 R script파일을 첨부합니다.. 제발 한번만 봐주세요ㅠㅠ
Comment 1
-
cardiomoon
2018.06.05 08:57
No. | Subject | Author | Date |
---|---|---|---|
1234 | 요즘 아주 잘 쓰고 있습니다. [1] | 김승욱 | 2015.08.17 |
1233 | 자료 (xlsx or CSV) [2] | medi79 | 2015.08.31 |
1232 | 혹시 이런 질문 드려도 되는지 모르겠습니다. [5] | 고든 | 2015.09.07 |
1231 | RM ANOVA [2] | flocky | 2015.09.09 |
1230 | ANCOVA에 대해서 여쭤보고 싶습니다. [5] | 고든 | 2015.09.13 |
1229 | sensitivity, specificity 계산가능여부 여쭤봅니다. [2] | 곽미리 | 2015.09.16 |
1228 | 표만들기에서 질문드립니다. [3] | wiswis | 2015.09.22 |
1227 | Standard error [2] | R까기 | 2015.09.24 |
1226 | 결측값 처리와 관련하여 [3] | 화모기 | 2015.10.07 |
1225 | 표만들기_2차그룹변수로 했을 때 결과물 이상 [1] | 화모기 | 2015.10.10 |
1224 | 로지스틱 회귀분석 반응변수 수 제한 [3] | 화모기 | 2015.10.11 |
1223 | 향후 5년간 핵심 화두가 Cognitive Business가 될 것 같아 먼저 여기에 글을 올립니다. [2] | Ben | 2015.10.14 |
1222 | 파일업로드에 대해 문의드립니다. [3] | flapper | 2015.10.15 |
1221 | 스피어만 상관계수(Spearman correlation coefficient) [1] | ㅎㅎㅎ | 2015.10.15 |
1220 | PSM에 관해 문의 드립니다. [3] | sodium75 | 2015.10.19 |
1219 | ROC 분석과 관련하여 질문합니다. [1] | 송민지 | 2015.10.21 |
1218 | 파일 업로드 자체가 안되네요.. [3] | 주민호 | 2015.11.13 |
1217 | 사소한 건의사항이 있습니다. [1] | EPfunny | 2015.11.15 |
1216 | 나무분석 [3] | 조윤성 | 2015.12.02 |
1215 | 'x' and 'units' must have length > 0 에러 메세지 [4] | 빙하 | 2015.12.03 |
코드를 살펴보았는데 별 문제 없어보입니다.
그런데 질문을 이해 못하겠는데요. 전체 데이터의 긍정과 부정이 약 9:1인 데이터를 가지고 7:3으로 training set와 test set로 나누어 모델을 만들고 test데이터에 대해 prediction하는 경우에 약 9:1로 나올 것으로 예상됩니다. 코드의 결과도 약 9:1로 나오는데요?