데이터셋이 사용자별(ID) 물건카타고리별 구입여부(0, 1)가 포함된 binary 데이터입니다.
ex)
ID 전자제품류 가구류
1 1 1
2 0 1
3 1 1
.
.
.
총 8개의 제품 카타고리가 있고 이걸 ID별(약 5,000명) 군집분석 시 알 함수가 알고 싶습니다.
1. binary data의 상관분석
2. 군집의 수를 정하기 위한 binary 데이터의 계층적군집분석 방법
3. K값을 가지고 binary data 비계층적군집화방법
Comment 2
-
마술샘
2016.06.13 02:07
-
마술샘
2016.06.13 02:33
2,3번에 대한 답변은 아래 링크로 대신 하겠습니다
http://statdb1.uos.ac.kr/teaching/multi/chapter06-01.html
http://statdb1.uos.ac.kr/teaching/multi/chapter06-02.html
혹은 R 다변량통계분석의 제 11장 군집분석 부분을 참고하시면 되실겁니다
특히 343-353부분만 보셔도 되실겁니다
가까운 도서관에서 그 부분만 발취해서 보시면 좋으실겁니다
옛날에 군집분석 관련해서 논문 낸게 있는데 지금보니 많이 부족하지만 첨부합니다
No. | Subject | Author | Date |
---|---|---|---|
1114 | 성향점수 맞추기 [3] | alse | 2016.05.25 |
1113 | 아래에 올렸었는데요,, 5Y overall survival 구하는 법이요. [2] | 난둥 | 2016.05.26 |
1112 | 로지스틱 회귀 분석에서.. [1] | 최00 | 2016.05.27 |
1111 | 기본표를 만드는데 file이 이상하게 읽히는 것 같습니다. | 매일이5월 | 2016.06.02 |
1110 | 파일 불러오기 에러 [2] | 매일이5월 | 2016.06.02 |
1109 | 파일 불러오기 오류 [2] | 매일이5월 | 2016.06.02 |
1108 | RPubs에 있는 ROC curve analysis by cardiomoon [2] | hawk1227 | 2016.06.02 |
1107 | R 그래프 옮기기 [2] | hawk1227 | 2016.06.03 |
1106 | 생존분석 그래프 x축 시간 [3] | alse | 2016.06.07 |
1105 | 자료업로드에러 [3] | dejavu730 | 2016.06.07 |
1104 | 학생강의 project1 | cardiomoon | 2016.06.07 |
1103 | 결측치 처리에 대한 질문입니다. [2] | 매일이5월 | 2016.06.07 |
1102 | IBM의 R 컨소시엄 가입 | Ben | 2016.06.08 |
1101 | 서버 접속이 안됩니다 [2] | kim | 2016.06.08 |
» | binary data 군집분석 [2] | 노가리 | 2016.06.08 |
1099 | 생존 분석시 문제 [3] | selteen | 2016.06.09 |
1098 | 생존 분석을 하는데 질문이 있어 게시판에 글을 올립니다. [1] | namuhanayeyo | 2016.06.11 |
1097 | 독립(설명)변수 비정규 분포시. logistic regression 문의입니다. [1] | 매일이5월 | 2016.06.16 |
1096 | Simple linear regression 에서 설명변수의 특성 [3] | 매일이5월 | 2016.06.16 |
1095 | Rstudio 에러 문제 [2] | 화모기 | 2016.06.16 |
안녕하세요 마술샘입니다
1. binary data의 상관분석
일단 두 변수 모두 이분형 변수 이거나 순서형 변수이어야 합니다
spearman 검증을 사용하시면 됩니다
방법은 먼저 상관계수 검증을 위해 cor(데이터명, method="spearman", use="pairwise.complete.obs")
혹은 with(데이터명, cor(변인1,변인2, method="spearman"))으로 해주시면 되십니다
그리고 p값을 구하시기 위해서는 with(데이터명, cor.test(변인1,변인2, method="spearman"))으로 해주시면 됩니다
그러나 web-r에서는 회귀분석안에 상관분석을 들어가셔서 변수 넣으시고 spearman을 체크하시고 r 값과 p값을 체크해서 확인하시면 됩니다.
편하게 하세요~~~~~~