R과 통계분석 (Tidyverse 활용)

박동련 · 자유아카데미 · 2020-08-31

R의 발전 속도는 항상 놀라움을 금치 못할 정도입니다. 작년에 제2판이 발간된 후에도 많은 변화가 있었습니다. R 버전 4.0.2가 출시되었고, 패키지 dplyr도 버전 1.0.0으로 업데이트가 되면서 큰 변화가 있었습니다. 그 변화를 제대로 담기 위한 노력의 일환으로 제3판을 출간하게 되었습니다. 이 책은 제2판의 구성을 되도록 유지하면서도 tidyverse에 속한 패키지의 활용도를 더욱 높이는 방향으로 내용을 개정했습니다. 패키지 readr 등을 활용한 외부 데이터 불러오기와 업데이트된 dplyr와 tidyr에 의한 데이터 다듬기, 그리고 ggplot2에 의한 데이터의 시각화 등을 기본 개념부터 자세하게 설명함으로써 R을 처음 접하는 초보자도 가능한 한 어렵지 않게 R을 시작할 수 있도록 구성하였습니다. 나아가 패키지 stringr에 의한 문자 다루기와 purrr에 의한 프로그래밍, 그리고 데이터 시각화에 의한 자료탐색 과정 등을 제시하여 이미 R을 사용하고 있는 중급 사용자들에게도 실질적인 도움이 될 수 있도록 구성하였습니다. 또한 선형회귀모형과 더불어 로지스틱 회귀모형에 대해 소개함으로써 data science에서 가장 필요한 분석도구인 예측모형의 수립 과정도 다루었습니다. R은 data science 분야에서 사용되는 여러 프로그래밍 언어 중에서 가장 뛰어난 통계분석 기능이 있는 언어입니다. 게다가 tidyverse에 속한 많은 패키지들의 기능이 업데이트가 되면서 이제는 data science를 위한 최적의 프로그램이 되었다고 할 수 있습니다. Data scientist가 되기를 원하시는 분들에게 조금이나마 도움이 되기를 바라는 마음에서 이 책을 출간합니다. 출간 후 수정 사항이나 필요한 자료 등은 자유아카데미 자료실(http://www.freeaca.com)에서 찾아볼 수 있으니 참조하기를 바랍니다.

ISBN
9791158082819
출판일
2020-08-31
출판사
자유아카데미
저자
박동련