지금 머신러닝 공부를 하는데 결과가 이상하게 나와서 한번만 봐주실 수 있을까요??ㅠㅠ
나이브 베이즈 분류기로 댓글의 긍정 부정을 판별하려는데 클래스 불균형이 심각하면 그게 결과에 많이 영향을 미치나요?
만일 긍정과 부정이 9:1인 train데이터를 가지고 모델을 만들고 test데이터에 대해 prediction하는 경우에 컴퓨터는 무조건 긍정으로 판별하여
그 결과의 정확도가 test데이터의 부정label 갯수만큼 떨어지는것인지 궁금합니다.
제가 만든 데이터셋과 R script파일을 첨부합니다.. 제발 한번만 봐주세요ㅠㅠ
Comment 1
-
cardiomoon
2018.06.05 08:57
No. | Subject | Author | Date |
---|---|---|---|
1193 | 첫번째 행을 라벨로 사용 버튼 클릭시 에러 문의 [3] | 수담이 | 2023.05.04 |
1192 | 안녕하세요? web-R table 그리고 관련하여 문의드립니다. [4] | mkw7654 | 2023.05.02 |
1191 | 메타분석 U3 그래프 관련 문의드립니다 | 화이팅 | 2023.05.02 |
1190 | 교수님 안녕하세요~~ | 메시12 | 2023.04.29 |
1189 | 연속형 변수인데 범주형으로 인지됩니다. [2] | shararaku | 2023.04.28 |
1188 | 통계마당 [2] | ejo | 2023.04.27 |
1187 | moonBook 오류 관련 재문의드립니다. [1] | holyhyun | 2023.04.24 |
1186 | moonBook 사용시 오류메시지로 문의드립니다. [1] | holyhyun | 2023.04.24 |
1185 | 에러 문의 [2] | 화이팅 | 2023.04.19 |
1184 | Cox regression 에 대한 문의입니다. [2] | saga | 2023.04.18 |
1183 | PSM 문의 [3] | starwars | 2023.04.13 |
1182 | ggPS, ggPSMSummary function [6] | 로렌쵸메디치 | 2023.04.12 |
1181 | Survival 분석에 대해서 문의 드립니다. | 정훈신 | 2023.04.05 |
1180 | 안녕하세요. 분석 툴에 대해 문의드립니다. [1] | 스매직맨 | 2023.04.04 |
1179 | 드디어 publish 되었네요. [2] | 정지윤 | 2023.04.04 |
1178 | 연구동향분석 시 논문 데이터 정제 관련 [5] | vtlbtl | 2023.03.31 |
1177 | 안녕하세요 교수님 에러 문의드립니다 [2] | 소소 | 2023.03.26 |
1176 | 코딩값이 여러개인 변수에 대한 전체 p값을 알 수 있는 방법이 궁금합니다 | 쥬쥬즈주 | 2023.03.22 |
1175 | PSM 매칭 버튼 보이지 않음. | swpapa | 2023.03.19 |
1174 | group-based trajectory modeling | swpapa | 2023.03.19 |
코드를 살펴보았는데 별 문제 없어보입니다.
그런데 질문을 이해 못하겠는데요. 전체 데이터의 긍정과 부정이 약 9:1인 데이터를 가지고 7:3으로 training set와 test set로 나누어 모델을 만들고 test데이터에 대해 prediction하는 경우에 약 9:1로 나올 것으로 예상됩니다. 코드의 결과도 약 9:1로 나오는데요?