안녕하세요.
데이터 전처리하는데 어려움을 겪고있어 문의드립니다.
sample |
abc |
def(33.5412°, 127.5417°) |
ghi(33.8654°, 127.7651°) |
위 표와같은 데이터 프레임 org 를 "("를 기준으로 나누어 2개의 열(sample, location)로 만드려고 합니다.
--------------------------------------------------------------------------------
org_new <- data.table()
n <- nrow(org)
for(i in 1:n){
sample <- as.character(org[i,])
if(org[i,] != grep(intToUtf8(176), org$sample, value = T)){
org_temp <- data.frame(sample)
org_temp2 <- mutate(org_temp, location = NA)
org_new <- rbind(org_new, org_temp2)
}else {
org_split <- data.frame(str_split_fixed(sample, pattern = "\\(", n = 2))
names(org_split) <- c("sample", "location")
org_new <- data.frame(rbind(org_new, org_split))
}
}
--------------------------------------------------------------------------------
위의 코드를 작동시키면 아래 표와 같은 결과와 에러메시지가 뜹니다.
sample | location |
abc | NA |
def | 33.5412°, 127.5417°) |
ghi(33.8654°, 127.7651°) | NA |
length > 1 이라는 조건이 있고, 첫번째 요소만이 사용될 것입니다.
sample | location |
abc | NA |
def | 33.5412°, 127.5417°) |
ghi | 33.8654°, 127.7651°) |
다음과 같이 아래에도 함수가 적용되려면 어떻게 수정해야 할까요...
Comment 3
-
cardiomoon
2021.03.25 18:35
-
꼬청
2021.03.26 14:59
마지막 표와같이 분리되었으면 좋겠습니다
-
cardiomoon
2021.03.26 22:26
sample=list("abc","def(33.5412°, 127.5417°)","ghi(33.8654°, 127.7651°)")
divide=function(x){
result=unlist(strsplit(x,"\\("))
if(length(result)==1) result=c(result,NA)
result
}
result=unlist(lapply(sample,divide))
no=length(result)
sample=result[seq(1,no,2)]
location=result[seq(2,no,2)]
data.frame(sample=sample,location=location)
No. | Subject | Author | Date |
---|---|---|---|
1194 | PSM 시 범주형 변수가 총 10가지 일 때 어떻게 돌려야 하는지요 [1] | 긍정적인마음가짐 | 2023.05.06 |
1193 | 첫번째 행을 라벨로 사용 버튼 클릭시 에러 문의 [3] | 수담이 | 2023.05.04 |
1192 | 안녕하세요? web-R table 그리고 관련하여 문의드립니다. [4] | mkw7654 | 2023.05.02 |
1191 | 메타분석 U3 그래프 관련 문의드립니다 | 화이팅 | 2023.05.02 |
1190 | 교수님 안녕하세요~~ | 메시12 | 2023.04.29 |
1189 | 연속형 변수인데 범주형으로 인지됩니다. [2] | shararaku | 2023.04.28 |
1188 | 통계마당 [2] | ejo | 2023.04.27 |
1187 | moonBook 오류 관련 재문의드립니다. [1] | holyhyun | 2023.04.24 |
1186 | moonBook 사용시 오류메시지로 문의드립니다. [1] | holyhyun | 2023.04.24 |
1185 | 에러 문의 [2] | 화이팅 | 2023.04.19 |
1184 | Cox regression 에 대한 문의입니다. [2] | saga | 2023.04.18 |
1183 | PSM 문의 [3] | starwars | 2023.04.13 |
1182 | ggPS, ggPSMSummary function [6] | 로렌쵸메디치 | 2023.04.12 |
1181 | Survival 분석에 대해서 문의 드립니다. | 정훈신 | 2023.04.05 |
1180 | 안녕하세요. 분석 툴에 대해 문의드립니다. [1] | 스매직맨 | 2023.04.04 |
1179 | 드디어 publish 되었네요. [2] | 정지윤 | 2023.04.04 |
1178 | 연구동향분석 시 논문 데이터 정제 관련 [5] | vtlbtl | 2023.03.31 |
1177 | 안녕하세요 교수님 에러 문의드립니다 [2] | 소소 | 2023.03.26 |
1176 | 코딩값이 여러개인 변수에 대한 전체 p값을 알 수 있는 방법이 궁금합니다 | 쥬쥬즈주 | 2023.03.22 |
1175 | PSM 매칭 버튼 보이지 않음. | swpapa | 2023.03.19 |
원하시는 최종결과가 어떤것인지요?