지금 머신러닝 공부를 하는데 결과가 이상하게 나와서 한번만 봐주실 수 있을까요??ㅠㅠ
나이브 베이즈 분류기로 댓글의 긍정 부정을 판별하려는데 클래스 불균형이 심각하면 그게 결과에 많이 영향을 미치나요?
만일 긍정과 부정이 9:1인 train데이터를 가지고 모델을 만들고 test데이터에 대해 prediction하는 경우에 컴퓨터는 무조건 긍정으로 판별하여
그 결과의 정확도가 test데이터의 부정label 갯수만큼 떨어지는것인지 궁금합니다.
제가 만든 데이터셋과 R script파일을 첨부합니다.. 제발 한번만 봐주세요ㅠㅠ
Comment 1
-
cardiomoon
2018.06.05 08:57
No. | Subject | Author | Date |
---|---|---|---|
814 | 교수님 안녕하세요 서버 구축관련하여 질문드립니다. [2] | 우루루루 | 2018.05.11 |
813 | 불충분한 데이터의 생존분석에 관하여 질문드립니다. [2] | fermion503 | 2018.05.14 |
812 | nomogram [5] | 횽횽 | 2018.05.16 |
811 | WebR관련 문의드립니다. [1] | neurojang | 2018.05.17 |
810 | 설명 변수 고르기에 대해서.. [2] | 짱이야 | 2018.05.25 |
809 | 인류 역사상 최고의 천재였다는 남자.jpg | 소꿈노리 | 2018.05.25 |
808 | 선생님 책으로 공부중인데..질문있습니다. [1] | jsus | 2018.05.26 |
807 | 안녕하세요 공부하던 중 질문드립니다. [1] | Ikarus86 | 2018.05.27 |
806 | 범주형변수와 비정규분포 연속형 변수 간 관계를 볼때 이변량 상관관계 분석이 가능한지요? [1] | 아라리 | 2018.05.30 |
» | 교수님 안녕하세요 질문이 있습니다 [1] | 세발낙지 | 2018.06.03 |
804 | Hodges-Lehman estimator [1] | 김밥친구 | 2018.06.04 |
803 | 단독망에서 패키지 실행 질문있습니다. [1] | 김지은22 | 2018.06.05 |
802 | shiny 한글 문제 문의드립니다. [3] | suny | 2018.06.07 |
801 | 정회원 서버 접속이 안되네요 [1] | iamswchoi | 2018.06.09 |
800 | MetaAnalyiss를 다루고 있는 책이 있는지요? [2] | 에구머니나 | 2018.06.11 |
799 | 고수분들의 도움이 필요합니다!!!! [2] | 강구몬 | 2018.06.13 |
798 | ggkm download [1] | yongjuncha | 2018.06.13 |
797 | 건강 두뇌 몸에 좋은 좋은글 한번씩 읽고들가세요 ^^ | 송유나 | 2018.06.16 |
796 | ROC 커브 분석 관련 질문 드립니다. [1] | odd82 | 2018.06.30 |
795 | 교수님 univariate, multivariate analysis 관련하여 질문드립니다. [2] | 우루루루 | 2018.07.03 |
코드를 살펴보았는데 별 문제 없어보입니다.
그런데 질문을 이해 못하겠는데요. 전체 데이터의 긍정과 부정이 약 9:1인 데이터를 가지고 7:3으로 training set와 test set로 나누어 모델을 만들고 test데이터에 대해 prediction하는 경우에 약 9:1로 나올 것으로 예상됩니다. 코드의 결과도 약 9:1로 나오는데요?