지금 머신러닝 공부를 하는데 결과가 이상하게 나와서 한번만 봐주실 수 있을까요??ㅠㅠ
나이브 베이즈 분류기로 댓글의 긍정 부정을 판별하려는데 클래스 불균형이 심각하면 그게 결과에 많이 영향을 미치나요?
만일 긍정과 부정이 9:1인 train데이터를 가지고 모델을 만들고 test데이터에 대해 prediction하는 경우에 컴퓨터는 무조건 긍정으로 판별하여
그 결과의 정확도가 test데이터의 부정label 갯수만큼 떨어지는것인지 궁금합니다.
제가 만든 데이터셋과 R script파일을 첨부합니다.. 제발 한번만 봐주세요ㅠㅠ
Comment 1
-
cardiomoon
2018.06.05 08:57
No. | Subject | Author | Date |
---|---|---|---|
1234 | 안녕하세요 에러 관련 문의드립니다 [1] | 화이팅 | 2023.09.19 |
1233 | 선형회귀분석 시 보정변수 사용 관련 질문드립니다. [2] | 전한울 | 2023.09.18 |
1232 | 그래프 관련 문의드립니다. | nanak | 2023.09.14 |
1231 | 영수증 메일로 받을수 있을까요? [1] | 딸기공주 | 2023.09.13 |
1230 | mycsv 관련 문의드립니다. [1] | 도삼 | 2023.09.12 |
1229 | matched group 을 대상으로 stratified cox | saga | 2023.09.06 |
1228 | IPTW 시 SMD 계산 관련 여쭙습니다. | 장한나 | 2023.09.04 |
1227 | 회귀분석 관련 문의드립니다. [2] | 전한울 | 2023.09.04 |
1226 | PSM matching 실행시 disconnected 됩니다... [1] | 맹구모션 | 2023.08.25 |
1225 | 메타분석_출간오류분석 관련 질문드립니다. [2] | 블루레몬 | 2023.08.21 |
1224 | plot 문의 드립니다. | 1122 | 2023.08.20 |
1223 | semMediation 설치문의 [2] | 마술샘 | 2023.08.11 |
1222 | 로지스틱 회귀분석 문의드립니다. [2] | JKJ | 2023.08.09 |
1221 | 지출 문의 드립니다. [1] | 블루레몬 | 2023.08.08 |
1220 | autoReg 실행 중 에러 [1] | pkjsdf123 | 2023.08.08 |
1219 | 영수증 처리 [1] | britnepak | 2023.07.28 |
1218 | multipleROC 커브 글을 따라가다 궁금한 것이 생겨서 질문드립니다. [2] | rgppwls | 2023.07.20 |
1217 | disconnected from server 오류 [2] | JKJ | 2023.07.13 |
1216 | mytable에서 변수 순서와 ztable적용시 변수가 숫자로 변형 [1] | 둥니맨 | 2023.07.12 |
1215 | box plot 시 X 축 label이 다 나오지 않아 질문드립니다. [2] | 난둥 | 2023.07.03 |
코드를 살펴보았는데 별 문제 없어보입니다.
그런데 질문을 이해 못하겠는데요. 전체 데이터의 긍정과 부정이 약 9:1인 데이터를 가지고 7:3으로 training set와 test set로 나누어 모델을 만들고 test데이터에 대해 prediction하는 경우에 약 9:1로 나올 것으로 예상됩니다. 코드의 결과도 약 9:1로 나오는데요?