Skip to menu

선생님 안녕하세요 r-통계를 잘 활용하고 있는 사람중에 한명입니다.


선생님 덕분에 많은 혜택을 받고 있는 것 같아 먼저 감사 말씀을 드립니다.


web- r통계에서 Pearson-moment correlation으로 correlation plot을 만들었는데,

이 plot이 유효한 것인지 궁금해서 여쭤보게 되었습니다.

문제는 제가 correlation 통계를 돌린 것이 이분형-이분형 / 이분형-연속형 / 연속형-연속형 변수가 같이 혼재되어 있다는 것입니다.

변수별로 따로 나눠서 통계를 돌려야 할가 고민하였지만, 연속형변수와 이분형 변수의 관계를 correlation plot으로 한눈으로 볼 수 있다는 것이, 시각적으로 유용한 것 같습니다.


그래서 해결책을 찾다가,

0,1 ( 없음, 있음)으로 코딩된 이분형변수와 연속형 변수 간 관계를 point-biserial correlation으로 볼 수 있다고 알게되었는데, 이는 spss 이변량 분석법 중 pearson을 이요해서 할 수 있다고 합니다.

다만 연속형변수가 정규형분포고 outlier가 없는 조건을 만족해야한다고 합니다.


그런데, 제 자료의 연속형 변수는 outlier가 3개가 있고, 연속형 변수가 Shapiro-Wilk test에서 p<0.05로 정규분포를 만족하지 않습니다.


bisersial test가 spss에서는 이변량을 통해서 할 수는 있으나

correlation analyasis는 보통 연속형 변수간의 상관성을 보는 경우가 대부분인 것 같습니다.


질문 드리고 싶은 것은

1. 제 자료중 이분형변수와 비정규분포 연속형 변수간의 관계를 보려면, biserial test (이변량 분석)를 사용해도 될까요?

2. 이변량 상관분석에서 pearson을 그대로 써도 될지요? (정규성 분포를 하지 않아 spearman이나 kendall tau-b를 쓰면 안될까요?)

3. Mann-Whitney를 사용하여 비교통계를 결국엔 해야할지요?


4. web-r에서 correlation test 결과를 이분법-비정규분포 연속형 변수간 써도 딜지요?

5. web-r에서 자료를 도표화해주는 Pearson-moment correlation plot을 연속형-범주형 사이에 사용해도 될지

6. 만약 위의 correlation plot을 사용하지 못한다면 전체적으로 상관성을 볼 수 있는 시각화자료는 없을지


여쭤보고 싶습니다.


바쁘신 와중에 일면식정도인 사람의 질문을 받아주셔서 감사합니다.

No. Subject Author Date
1094 안녕하세요 r 코드 중에 도저히 해결이 안나는 문제가 있어서 여기에 문의 드립니다 [1] file 슈퍼맨 2022.06.24
1093 Box plot 그리프 설정에 관해 문의합니다. papahong 2022.06.20
1092 cluster data 의 risk difference 에 대해 여쭙고자 합니다. lagrima 2022.06.19
1091 Pair plot을 할 경우 [1] PipeDragoN 2022.06.13
1090 PSM에서 matching 버튼 위치 문의 통계어려워 2022.06.13
1089 PSM (4그룹) 관련 문의드립니다. emksh77 2022.06.08
1088 정회원후원하였습니다. [1] secret rosemary 2022.06.08
1087 PSM 문의 [2] secret sfumatoi 2022.06.07
1086 multipleROC 패키지에서 multivariable의 cutoff 구하기 file 찬쓰 2022.06.07
1085 survival analysis관련 문의 드립니다 [1] cebukim 2022.06.04
1084 autoReg 설치 관련 오류 [5] 닥터강 2022.05.24
1083 survival tree (RPA) 분석 관련 문의 드립니다. [2] 곰곰11 2022.05.23
1082 통계 질문입니다. [1] file 봄봄봄 2022.05.23
1081 데이터 불러오기 문제 [3] strat 2022.04.25
1080 r프로그래밍 문자는 factor로 읽을 수 없나요? [1] file 채채채추ㅐㅊ채야채 2022.04.21
1079 R 코드와 관련하여 문의 드려도 될까요..? [5] file 꾸이뭉 2022.04.19
1078 R 업데이트 후 mytable 함수 에러가 있습니다. [1] 카이토르 2022.04.18
1077 Survival curve 에서 cumulative incidence % 로 표현 가능할까요 [1] nyknicks 2022.04.16
1076 multiple logistic regression test에서 설명변수 선택에 대해 여쭙습니다. [2] file kms9057 2022.04.16
1075 PSM 문의 드립니다 [1] caesar 2022.04.07