Skip to menu

통계 공부를 이제 한달 시작한 새내기입니다.

통계에 대해 물어볼 데가 마땅치 않아서 여기에다가 질문을 올리는 것에 죄송합니다.

 

제가 공부한 바로는 평균이 특잇값에 로버스트하지 않아서 중간값이나 최빈값을 사용하는 거라고 이해했습니다.

개인적으로 느껴지는 바로는 중간값이 상업적으로 사용되기에는 거리가 있다고 생각합니다.(가중평균이나 차라리 최빈값을 이용할 것 같습니다.)

 

교제를 읽었을 때(데이터 과학을 위한 통계 - 46p) '최빈값은 범주형 데이터를 분석하는데 간단히 사용된다. 하지만 수치 데이터에는 잘 사용하지 않는다.'

는 구문이 이해가 되지 않았습니다.

 

Q. 수치 데이터에서 최빈값을 이용해서 통계 결론을 도출하였을 경우 어떠한 문제가 있어서 사용되지 않는건가요? 아니면, 단순 성능문제(중간값보다 최빈값이 계산하는데 시간이 오래 걸림) 때문에 사용되지 않는건가요?