수고 많으십니다.
최근 클릭만으로 하는 R통계분석 책을 통해 많은 도움을 받고 있습니다.
한 가지 여쭤보고 싶은 것은 결측값와 관련된 것입니다.
명목변수의 경우 결측값을 NA 로 하든지 공백으로 비워놓든지 간에
plot 으로 그릴 때 혹은 table 에 표시되는 값이 NA 로 또는 공백으로 표시가 됩니다.
결측값에 해당하는 내용은 그림이나 표에 나오지 않게 하는 방법은 없을까요?
(연속변수의 경우 결측값을 NA 로 하든 공백이든지 간에 결측값을 제외하고 분석이 시행되는 것이 맞는 것이지요?)
변수가 600여개, 관측치가 5000여명 되는 데이터라서 각 변수마다 결측값이 다양하게 분포되어 있습니다.
조언 부탁드립니다.
감사합니다.
Comment 3
-
cardiomoon
2015.10.07 16:18
-
cardiomoon
2015.10.07 19:50
선생님의 데이타 파일에 예를 들어 sex라는 열이 있는데 여기에 남,여가 아닌 공백이 입력되어 있다고 합시다. 이 때 표나 plot을 그리면 공백도 데이타 값으로 간주되어 표에 나올 겁니다.
이때에는 전처리를 통해 이 데이타 중 sex의 값이 ""인 것을 제외하면 됩니다.
웹R에 데이타를 올리시면 사용할 데이타가 cleanData(my_readfile(input$file))로 되어 있을 겁니다.
1) 전처리하기에 다음과 같이 입력합니다.
data= cleanData(my_readfile(input$file))
data1=data[data$sex!="",]
2) 데이타전처리하기 체크박스를 선택합니다.
3) 그리고 사용할 데이타에 data1 이라고 입력하시면 앞으로 분석에 sex열이 ""인 행은 제외하고 진행됩니다.
-
화모기
2015.10.08 04:23
네, 결국 각 명목변수별로 결측값을 제외한 데이터를 각각 만들어야 하는 것이군요.
자세한 설명 감사합니다.
No. | Subject | Author | Date |
---|---|---|---|
1054 | 기초적인 질문이지만 .. 여쭤봅니다. [2] | 나현둥 | 2021.12.13 |
1053 | 통계와 관련한 기초적인 질문 드립니다.. [2] | 감사합니다 | 2021.12.10 |
1052 | 메타분석 해석 문의 [2] | 루아로 | 2021.12.07 |
1051 | 초보라 질문드립니다 ㅜ [2] | 쵸쿄쵸쿄 | 2021.12.06 |
1050 | ㅠㅠㅠ 초보 질문입니다 [1] | 만고 | 2021.11.26 |
1049 | 라벨붙이기가 안됩니다 [1] | 찬미맘 | 2021.11.22 |
1048 | moonBook ANOVA 질문드립니다. [1] | 타쿠 | 2021.11.20 |
1047 | 3원 분할표? 에서 모델 만드는법 | 플랫슬립 | 2021.11.20 |
1046 | [회귀분석 초급 질문] [1] | 서빱스 | 2021.11.14 |
1045 | [ANOVA 분석 질문] [1] | 서빱스 | 2021.11.14 |
1044 | 대조군1과 치료군2,3,4 의 PSM 에 관해서 질문있습니다. [4] | yessul | 2021.11.11 |
1043 | 서버접속이 안됩니다. Reload [2] | silkywater | 2021.11.11 |
1042 | 메타분석 실행이 안됩니다. [1] | 애플K | 2021.11.08 |
1041 | pair plot 관련하여 질문드립니다. | ulysses11 | 2021.10.29 |
1040 | 메타분석 결과파일 다운로드 하려면 [1] | mono | 2021.10.23 |
1039 | 기본 baseline character table문의드립니다. [1] | ulysses11 | 2021.10.22 |
1038 | 이 error는 뭐가 문제인 걸까요 [1] | CSJU | 2021.10.19 |
1037 | logistic regression에서 p>0.05인 변수의 OR, p 값... | 브이콘65 | 2021.10.14 |
1036 | R 문제가 도저히 안풀려요.. [1] | 자하연미필 | 2021.10.09 |
1035 | 구조방정식에서 종속변수가 0,1로 코딩된 데이터 사용이 가능한가요? [1] | 순수엄마 | 2021.10.08 |
데이타 전처리하기에서 plot에서 그리지 않기를 원하는 결측치를 제외한 데이타를 새로 정의하고 그 데이타로 plot을 그리시면 될 것 같습니다.
예는 조금 후에 보여드리겠습니다.