Skip to menu

안녕하세요, 현재 연구용역과제로 연구동향분석을 하고 있는데요,

 

분석을 위해 논문 PDF 파일을 텍스트(TXT) 파일에 옮기니, 한 문장 단위로 잘 끊어지지가 않아서요

 

예를 들어, 

 

철수는 밥을 먹습니다.

영희는 김치를 먹습니다

 

이렇게 나와야하는데, 

 

철수는 밥을 

먹습니다

영희는 김

치를 먹습니다

 

 

이렇게 끊어져서 '김치'같은 원래 하나인 단어마저 단어로 인식되지 않을 것 같은데

 

이런 상태로 분석을 진행해도 결과에 지장이 없을까요? (분석은 토픽모델링, 네트워크 분석 진행할 예정입니다)

 

아니면 R에서 문장을 연결해주는 그런 기능이 있을까요?

 

지금 하나하나 문장 이어붙이는 노가다 중인데 너무 번거로워서요..