R로 배우는 텍스트 마이닝 (tidytext 라이브러리를 활용하는 방법)

줄리아 실기, 데이비드 로빈슨 · 제이펍 · 2019-06-04

텍스트 데이터를 정리하고 시각화하기 위한 새로운 방법! tidytext 라이브러리와 그 밖의 정돈 텍스트 분석 방법을 배운다! 요즘 사용할 만한 데이터는 비정형 데이터이거나 텍스트 위주로 구성되어 있다. 하지만 이러한 데이터는 분석가들이 일상적으로 사용하는 데이터 랭글링 도구나 시각화 도구를 적용하기가 쉽지 않다. 그러나 줄리아 실기와 데이비드 로빈슨이 개발한 tidytext 패키지라면 이야기가 달라진다. tidytext 패키지는 ggplot2나 dplyr 같은 R 패키지에 깔려 있는 정돈(tidy, 깔끔화) 원리를 바탕으로 개발되었는데, 이 책을 통해 여러분은 tidytext와 R에서 쓸 수 있는 그 밖의 정돈 도구들로 텍스트를 더욱 쉽고 효율적으로 분석하는 방법을 익힐 수 있다.

ISBN
9791188621552
출판일
2019-06-04
출판사
제이펍
저자
줄리아 실기, 데이비드 로빈슨