Skip to menu

선생님 안녕하세요 r-통계를 잘 활용하고 있는 사람중에 한명입니다.


선생님 덕분에 많은 혜택을 받고 있는 것 같아 먼저 감사 말씀을 드립니다.


web- r통계에서 Pearson-moment correlation으로 correlation plot을 만들었는데,

이 plot이 유효한 것인지 궁금해서 여쭤보게 되었습니다.

문제는 제가 correlation 통계를 돌린 것이 이분형-이분형 / 이분형-연속형 / 연속형-연속형 변수가 같이 혼재되어 있다는 것입니다.

변수별로 따로 나눠서 통계를 돌려야 할가 고민하였지만, 연속형변수와 이분형 변수의 관계를 correlation plot으로 한눈으로 볼 수 있다는 것이, 시각적으로 유용한 것 같습니다.


그래서 해결책을 찾다가,

0,1 ( 없음, 있음)으로 코딩된 이분형변수와 연속형 변수 간 관계를 point-biserial correlation으로 볼 수 있다고 알게되었는데, 이는 spss 이변량 분석법 중 pearson을 이요해서 할 수 있다고 합니다.

다만 연속형변수가 정규형분포고 outlier가 없는 조건을 만족해야한다고 합니다.


그런데, 제 자료의 연속형 변수는 outlier가 3개가 있고, 연속형 변수가 Shapiro-Wilk test에서 p<0.05로 정규분포를 만족하지 않습니다.


bisersial test가 spss에서는 이변량을 통해서 할 수는 있으나

correlation analyasis는 보통 연속형 변수간의 상관성을 보는 경우가 대부분인 것 같습니다.


질문 드리고 싶은 것은

1. 제 자료중 이분형변수와 비정규분포 연속형 변수간의 관계를 보려면, biserial test (이변량 분석)를 사용해도 될까요?

2. 이변량 상관분석에서 pearson을 그대로 써도 될지요? (정규성 분포를 하지 않아 spearman이나 kendall tau-b를 쓰면 안될까요?)

3. Mann-Whitney를 사용하여 비교통계를 결국엔 해야할지요?


4. web-r에서 correlation test 결과를 이분법-비정규분포 연속형 변수간 써도 딜지요?

5. web-r에서 자료를 도표화해주는 Pearson-moment correlation plot을 연속형-범주형 사이에 사용해도 될지

6. 만약 위의 correlation plot을 사용하지 못한다면 전체적으로 상관성을 볼 수 있는 시각화자료는 없을지


여쭤보고 싶습니다.


바쁘신 와중에 일면식정도인 사람의 질문을 받아주셔서 감사합니다.