지금 머신러닝 공부를 하는데 결과가 이상하게 나와서 한번만 봐주실 수 있을까요??ㅠㅠ
나이브 베이즈 분류기로 댓글의 긍정 부정을 판별하려는데 클래스 불균형이 심각하면 그게 결과에 많이 영향을 미치나요?
만일 긍정과 부정이 9:1인 train데이터를 가지고 모델을 만들고 test데이터에 대해 prediction하는 경우에 컴퓨터는 무조건 긍정으로 판별하여
그 결과의 정확도가 test데이터의 부정label 갯수만큼 떨어지는것인지 궁금합니다.
제가 만든 데이터셋과 R script파일을 첨부합니다.. 제발 한번만 봐주세요ㅠㅠ
Comment 1
-
cardiomoon
2018.06.05 08:57
No. | Subject | Author | Date |
---|---|---|---|
1254 | R서버 설치 문의드립니다. [4] | 화모기 | 2015.05.13 |
1253 | 초초 초보자 문의 드립니다^^ [2] | 매직하마 | 2017.12.22 |
1252 | mytable() 함수에 대한 질문입니다. [3] | 브리디온 | 2017.11.19 |
1251 | 묻고답하기 게시판을 운영합니다 [1] | cardiomoon | 2015.04.20 |
1250 | ANOVA, Kruskal-Wallis 검정 및 다중비교 [3] | 소오름 | 2016.03.31 |
1249 | ios | bnmy6581 | 2018.12.28 |
1248 | 예제 데이터 열 제목 편집방법 [2] | 신돌석 | 2016.04.25 |
1247 | rstudio 사이트에 연결할 수 없음 문제 [1] | 지원 | 2019.09.10 |
1246 | 로지스틱 회귀분석에 대해 질문 올립니다. [12] | SOL | 2017.09.15 |
1245 | Cox proportional analysis에서 subgroup분석에 대해 여쭙니다 | 김규 | 2017.09.30 |
1244 | rJava 에러 문제 해결에 대해 문의드립니다 [1] | mdhjcho | 2017.06.29 |
1243 | 3D 형태 그래프에 대해 질문드립니다. | 백지백지 | 2019.04.26 |
1242 | 메타분석의 변수지정 [1] | 야스오 | 2021.05.24 |
1241 | Logistic regression [3] | namuhanayeyo | 2017.03.02 |
1240 | 생존 분석 시 Cox-regression vs. Log-rank [2] | begabung | 2017.05.22 |
1239 | 표본설계시 subset 명령어 문의드립니다. [1] | 네잎클로바 | 2020.05.09 |
1238 | Rstudio 사용법` [3] | 방랑자 | 2015.05.02 |
1237 | Survdiff로 log-rank test 시 P-value 소수점 [3] | begabung | 2019.02.15 |
1236 | length 오류질문 [1] | 촙춉 | 2020.05.26 |
1235 | 메타분석-출판편향 [1] | 날아라 | 2019.08.26 |
코드를 살펴보았는데 별 문제 없어보입니다.
그런데 질문을 이해 못하겠는데요. 전체 데이터의 긍정과 부정이 약 9:1인 데이터를 가지고 7:3으로 training set와 test set로 나누어 모델을 만들고 test데이터에 대해 prediction하는 경우에 약 9:1로 나올 것으로 예상됩니다. 코드의 결과도 약 9:1로 나오는데요?