안녕하십니까?
웹R을 유용하게 사용하고 있는 유저입니다.
데이터 전처리 관련하여 문의드립니다.
Ver 3.1 및 정회원서버(Ver 3.5) 로 업데이트 되면서 데이터전처리 과정에 변화가 생긴 것 같습니다.
자료 업로드 시 uploaded file 체크박스가 없어졌고
'데이터 전처리하기' 에서 데이터 전처리를 위한 다음과 같은 명령문(예시)을 입력 후 많은 변수를 한 꺼번에 처리해서 분석할 수 있었는데 지금은 되지 않습니다.
dat=subset(my_readfile(input$file), sex!="NA")
dat$age_gr_f <- factor(dat$age_gr, levels = 1:4, labels = c("<1", "<6", "6-9", ">=10"))
이처럼 전처리 과정 후 데이터분석이 이전에 가능했었는데... Ver3.1 이후로 uploaded file 체크박스가 없어졌고
다음과 같은 에러메시지가 뜨고 분석이 되지 않습니다. (Ver2.1 에서는 됩니다)
Error: object 'myco' not found
여러 변수를 범주형변수(factor)로 만들어 순서를 정할 때가 많은데... 이런 과정이 '데이터 전처리하기'에서 되지 않습니다.
'자주하는 전처리'에서 이 작업이 가능하나... 변수 각각을 따로 해야해서 시간이 많이 소요되고 데이터 생성에 반영되지 않다보니
다음에 다시 분석 시 다시 입력해야하는 불편함이 따릅니다.
Ver 업데이트 이후 '자료전처리' 관련하여 변경된 부분을 제가 몰라서 그런 것인지...
답변 부탁드리겠습니다.
감사합니다.
Comment 7
-
cardiomoon
2017.09.28 16:43
1) 자료를 업로드 한후 uploaded 라디오 버튼을 누르는 것을 어려워하는 분이 많아 자료를 업로드하면 data 이름이 uploaded로 바뀝니다.2) 전처리하기에서 업로드한 파일은 uploaded라는 이름으로 접근하시면 됩니다. 예를들어 다음과 같이 해보세요dat<-subset(uploaded,ID<=5)dat$sum <- dat$A+dat$B그리고 난 후 데이타 이름을 dat라고 써주시면 될 것 같습니다. -
화모기
2017.09.28 18:50
교수님, 답변주신대로 해봤습니다만...
Error: object 'dat' not found 에러메시지가 여전히 생깁니다. 이하 분석도 되지 않습니다.
같은 작업을 Ver 2.1에서 하면 문제 없이 실행이 됩니다.
다른 문제가 있는 것일까요?
-
cardiomoon
2017.09.28 19:49
이상하네요. 데이터와 원하는 전처리 과정을 올려봐주셔요.
-
화모기
2017.09.28 23:20
데이터는 해당변수만 남겨놓은 축약본입니다.명령문은 아래와 같습니다.dat=subset(uploaded, RMPP7_f!="NA")dat$age_gr_f <- factor(dat$age_gr, levels = 2:4, labels = c("<6", "6-9", ">=10")) -
cardiomoon
2017.09.29 07:58
1) 보내주신 자료로 해보니 에러 없이 되는데요? 다음 화면 참조하세요
2) 첫번째 문장은 NA를 제외하시려는 것 같은데 원하시는대로 하려면 다음과 같이 하십시요.
dat=subset(uploaded, !is.na(RMPP7_f))
감사합니다.^^
-
화모기
2017.09.29 21:39
네, 교수님.전처리 후 아래 데이터 제시까지는 되는데 이후 표만들기를 비롯한 분석창에 들어가면 되지 않습니다.
다음과 같은 화면이 뜨고 '그룹변수 선택' 등 변수 선택이 되지 않습니다.
표만들기 등 통계분석 창에서도 실행이 되는지요?
-
cardiomoon
2017.09.30 16:59
네 그,런 문제가 있네요...이 문제는 소스를 좀 고쳐야해서 시간이 걸릴 것 같은데요 그전에는 preprocessing을 한 데이터를 csv 나 RDS로 저장하신후 그 파일을 다시 업로드하셔서 사용하시기 바랍니다. 빠른 시일 내에 해결하겠습니다. ㅠ..ㅜ
No. | Subject | Author | Date |
---|---|---|---|
1114 | 성향점수 맞추기 [3] | alse | 2016.05.25 |
1113 | 아래에 올렸었는데요,, 5Y overall survival 구하는 법이요. [2] | 난둥 | 2016.05.26 |
1112 | 로지스틱 회귀 분석에서.. [1] | 최00 | 2016.05.27 |
1111 | 기본표를 만드는데 file이 이상하게 읽히는 것 같습니다. | 매일이5월 | 2016.06.02 |
1110 | 파일 불러오기 에러 [2] | 매일이5월 | 2016.06.02 |
1109 | 파일 불러오기 오류 [2] | 매일이5월 | 2016.06.02 |
1108 | RPubs에 있는 ROC curve analysis by cardiomoon [2] | hawk1227 | 2016.06.02 |
1107 | R 그래프 옮기기 [2] | hawk1227 | 2016.06.03 |
1106 | 생존분석 그래프 x축 시간 [3] | alse | 2016.06.07 |
1105 | 자료업로드에러 [3] | dejavu730 | 2016.06.07 |
1104 | 학생강의 project1 | cardiomoon | 2016.06.07 |
1103 | 결측치 처리에 대한 질문입니다. [2] | 매일이5월 | 2016.06.07 |
1102 | IBM의 R 컨소시엄 가입 | Ben | 2016.06.08 |
1101 | 서버 접속이 안됩니다 [2] | kim | 2016.06.08 |
1100 | binary data 군집분석 [2] | 노가리 | 2016.06.08 |
1099 | 생존 분석시 문제 [3] | selteen | 2016.06.09 |
1098 | 생존 분석을 하는데 질문이 있어 게시판에 글을 올립니다. [1] | namuhanayeyo | 2016.06.11 |
1097 | 독립(설명)변수 비정규 분포시. logistic regression 문의입니다. [1] | 매일이5월 | 2016.06.16 |
1096 | Simple linear regression 에서 설명변수의 특성 [3] | 매일이5월 | 2016.06.16 |
1095 | Rstudio 에러 문제 [2] | 화모기 | 2016.06.16 |