다중로지스틱회귀분석을 하려고합니다.
그런데, 독립변수중에 어느 한 변수(이산형)가 0값이 아주 많은데,,,,,
이런 변수를 그대로 독립변수에 넣어도 괜찮나요?
※ 전체에서 35%정도가 0입니다.
※ 첨부파일참고(histogram)
Comment 1
-
아빠가들려주는통계김지형
2018.02.06 10:57
No. | Subject | Author | Date |
---|---|---|---|
453 | r studio server expired..여서 접속이 안됩니다 [2] | 스튜던트 | 2018.04.22 |
452 | 출판편향 오류 [2] | 알로하 | 2018.04.19 |
451 | time ROC 에 대해 질문드립니다. | YH | 2018.04.19 |
450 | PW 찾기가 안되어 문의드립니다. [2] | 요주식 | 2018.04.18 |
449 | 통계 공부에 대해서 질문드립니다! [1] | ykoy | 2018.04.18 |
448 | 질문 드립니다. [1] | 캐천사 | 2018.04.03 |
447 | cochrane armitage test 질문드립니다. [1] | 달려라하마 | 2018.04.02 |
446 | Propensity score matching 에 대해 질문드립니다 교수님 [2] | 우루루루 | 2018.03.25 |
445 | 그냥 넋두리.. [2] | 스튜던트 | 2018.03.25 |
444 | r studio server 가 오늘(3/15) 만료된다고 합니다 [2] | 스튜던트 | 2018.03.15 |
443 | 웹에서 하는 ggplot2에서.. [3] | suein | 2018.03.15 |
442 | web-R에서 사용되는 명령어를 볼 수 있는 방법이 있을까요? [1] | 통계장님 | 2018.03.15 |
441 | 안녕하세요? mytable에서 나온 결과를 워드 저장하는 방법에 대해 문의드립니다. [2] | 박만영 | 2018.03.12 |
440 | 메타분석에 관한 문의 드립니다. [1] | 봄날 | 2018.03.08 |
439 | ANOVA 결과 값이 다르게 나옵니다. 고견을 부탁드립니다 [3] | 에구머니나 | 2018.03.05 |
438 | ORplot 함수에서요.. [2] | 매직하마 | 2018.02.25 |
437 | 다항 로지스틱 회귀분석 | VL | 2018.02.23 |
436 | 로지스틱회귀분석 (OR, CI) | wjdEoddl | 2018.02.22 |
435 | 정회원용 서버가 접속이 안됩니다. [1] | 마늘맨 | 2018.02.16 |
» | 0이 많은 자료에 대해 [1] | wjdEoddl | 2018.02.05 |
사실 이런 것은 숫자로만 판단하기 힘들 것으로 생각됩니다.
임상적인 의미가 무엇인가가 더 중요할 수 있습니다.
한국인과 외국인들을 독립변수로 넣는다고 할 때,
외국인들이 인종별로 모두 다양할 텐데, 각각을 더미변수화 하여 넣을 것인가?
아니면 그냥 외국인들을 뭉뚱그려서 한국인:외국인으로 넣을 것인가 하는 문제와도 비슷합니다.
외국인이 얼마나 많은 빈도인가, 그리고, 그 외국인들이 비슷한 성향이라고 간주할 수 있는가
등등을 따져서 결정해야 하므로
임상적인 의미를 고려해서 넣어야 합니다.
즉, 1과, 2와, 3과, 4... 등등이 의미하는 바가 무엇인지에 따라,
두세 그룹으로 나누어서 넣을 수도 있고,
중앙값을 기준으로 2개로 나누기도 하고 등등...
=================================
그러므로, 지금과 같은 후향적인 연구라고 하더라도,
연구 계획(protocol)이 중요한 의미를 가지게 됩니다.
사전에 연구 계획을 가지고 진행하지 않으면
연구자가 데이터를 주무르기에 따라
의도한대로 결과를 보여주는 듯 착각하게 됩니다.