안녕하세요.
데이터 전처리하는데 어려움을 겪고있어 문의드립니다.
sample |
abc |
def(33.5412°, 127.5417°) |
ghi(33.8654°, 127.7651°) |
위 표와같은 데이터 프레임 org 를 "("를 기준으로 나누어 2개의 열(sample, location)로 만드려고 합니다.
--------------------------------------------------------------------------------
org_new <- data.table()
n <- nrow(org)
for(i in 1:n){
sample <- as.character(org[i,])
if(org[i,] != grep(intToUtf8(176), org$sample, value = T)){
org_temp <- data.frame(sample)
org_temp2 <- mutate(org_temp, location = NA)
org_new <- rbind(org_new, org_temp2)
}else {
org_split <- data.frame(str_split_fixed(sample, pattern = "\\(", n = 2))
names(org_split) <- c("sample", "location")
org_new <- data.frame(rbind(org_new, org_split))
}
}
--------------------------------------------------------------------------------
위의 코드를 작동시키면 아래 표와 같은 결과와 에러메시지가 뜹니다.
sample | location |
abc | NA |
def | 33.5412°, 127.5417°) |
ghi(33.8654°, 127.7651°) | NA |
length > 1 이라는 조건이 있고, 첫번째 요소만이 사용될 것입니다.
sample | location |
abc | NA |
def | 33.5412°, 127.5417°) |
ghi | 33.8654°, 127.7651°) |
다음과 같이 아래에도 함수가 적용되려면 어떻게 수정해야 할까요...
Comment 3
-
cardiomoon
2021.03.25 18:35
-
꼬청
2021.03.26 14:59
마지막 표와같이 분리되었으면 좋겠습니다
-
cardiomoon
2021.03.26 22:26
sample=list("abc","def(33.5412°, 127.5417°)","ghi(33.8654°, 127.7651°)")
divide=function(x){
result=unlist(strsplit(x,"\\("))
if(length(result)==1) result=c(result,NA)
result
}
result=unlist(lapply(sample,divide))
no=length(result)
sample=result[seq(1,no,2)]
location=result[seq(2,no,2)]
data.frame(sample=sample,location=location)
No. | Subject | Author | Date |
---|---|---|---|
1233 | 선형회귀분석 시 보정변수 사용 관련 질문드립니다. [2] | 전한울 | 2023.09.18 |
1232 | 그래프 관련 문의드립니다. | nanak | 2023.09.14 |
1231 | 영수증 메일로 받을수 있을까요? [1] | 딸기공주 | 2023.09.13 |
1230 | mycsv 관련 문의드립니다. [1] | 도삼 | 2023.09.12 |
1229 | matched group 을 대상으로 stratified cox | saga | 2023.09.06 |
1228 | IPTW 시 SMD 계산 관련 여쭙습니다. | 장한나 | 2023.09.04 |
1227 | 회귀분석 관련 문의드립니다. [2] | 전한울 | 2023.09.04 |
1226 | PSM matching 실행시 disconnected 됩니다... [1] | 맹구모션 | 2023.08.25 |
1225 | 메타분석_출간오류분석 관련 질문드립니다. [2] | 블루레몬 | 2023.08.21 |
1224 | plot 문의 드립니다. | 1122 | 2023.08.20 |
1223 | semMediation 설치문의 [2] | 마술샘 | 2023.08.11 |
1222 | 로지스틱 회귀분석 문의드립니다. [2] | JKJ | 2023.08.09 |
1221 | 지출 문의 드립니다. [1] | 블루레몬 | 2023.08.08 |
1220 | autoReg 실행 중 에러 [1] | pkjsdf123 | 2023.08.08 |
1219 | 영수증 처리 [1] | britnepak | 2023.07.28 |
1218 | multipleROC 커브 글을 따라가다 궁금한 것이 생겨서 질문드립니다. [2] | rgppwls | 2023.07.20 |
1217 | disconnected from server 오류 [2] | JKJ | 2023.07.13 |
1216 | mytable에서 변수 순서와 ztable적용시 변수가 숫자로 변형 [1] | 둥니맨 | 2023.07.12 |
1215 | box plot 시 X 축 label이 다 나오지 않아 질문드립니다. [2] | 난둥 | 2023.07.03 |
1214 | 안녕하십니까 교수님 PSM 결과에 대해 궁금한 것이 있어 여쭤봅니다 [2] | 김도훈 | 2023.06.29 |
원하시는 최종결과가 어떤것인지요?