Type<-c("K5","K3","K5","K5","소나타","그랜져","I40","소나타","K3","K5")
fuel<-c("디젤","휘발유","전기","디젤","디젤","휘발유","전기","전기","휘발유","디젤")
number<-c("12가3456","12나3456","12다3456","12라3456","12마3456","12바3456","12사3456","12아3456","12자3456","12차3456")
data<-data.frame(Type,fuel,number) #첫번째 데이터
data<-data%>%mutate(ID=NA) #ID 부분을 temp, temp2, temp3 통해 매치시키기
ID<-c("홍길동","차승원","이기태","한영권","안정민","이기세","원상호","한기태","정지훈","안시훈","이홍철","강원래","고현식","김도영")
number1<-c("12가3456","12나34**","12다34**","12라34**","**마3456","12바3456","12사3456","12아3456","12자3456","12차3456","12카3456","12하3456","12호3456","12허3456")
temp<-data.frame(ID,number1) #첫번째 임시 데이터
data$ID<-temp$ID[match(data$number,temp$number1)] #60% 찾음
ID1<-c("홍길동","차승원","이기태","한영권","안정민","이기세","원상호","한기태","정지훈","안시훈","이홍철","강원래","고현식","김도영")
number2<-c("12가3456","12나3456","12다3456","12라3456","**마3456","12바34**","12사34**","12아34**","12자3456","12차3456","12카3456","12하3456","12호3456","12허3456")
temp2<-data.frame(ID1,number2) #두번째 데이터
data$ID<-temp2$ID1[match(data$number,temp2$number2)] #40% 찾음
#<첫번째 질문>
#data 에 있는 ID변수를 첫번째 임시 데이터에서 60% 정도 찾았습니다.
#못 찾은 데이터는 두번째 임시 데이터에서 40% 찾았습니다.
#문제는 두번째 임시 데이터에서 찾을때, 첫번째 임시 데이터에서 찾아진 데이터는 덮어쓰기로인해 NA가 됩니다.
#기존에 입력된 ID를 유지하면서 NA로된 데이터를 찾는 방법이 궁금합니다.
ID1<-c("홍길동","차승원","이기태","한영권","안정민","이기세","원상호","한기태","정지훈","안시훈","이홍철","강원래","고현식","김도영")
number2<-c("12가3456","12나3456","12다3456","12라3456","**마3456","12바34**","12사34**","12아34**","12자3456","12차3456","12카3456","12하3456","12호3456","12허3456")
Type1<-c("K5","K3","K5","K5","소나타","그랜져","I40","소나타","K3","K5","K3","소나타","I40","그랜져")
temp3<-data.frame(ID1,number2,Type1)
data$ID<-temp3$ID1[match(data$Type,data$number,data3$number2,data3$Type1)]
# <두번째 질문>
# 만약 차량번호가 가려져있다면 가려지지않은 차량번호의 일부와 차종으로 차주를 찾고 싶습니다.
# match함수 후 괄호열고 어떤식으로 값을 입력해야 제가 원하는 방법대로 출력이될까요?
# 엑셀은 vlookup함수로 범위를 선택하여 원하는 값을 찾을 수 있던데..
# 여러방법 중 merge함수로 해봐도 안되고 더 서치해본 결과 match 함수가 가장 제 요구치에 근접한 함수란 걸 깨달았습니다.
# 언제나 감사드리고 또 궁금한거 여쭙니다!
Comment 0
No. | Subject | Author | Date |
---|---|---|---|
1253 | logistic regression 명령어 문의드립니다. [2] | 로렌쵸메디치 | 2023.11.22 |
1252 | spss 파일 불러오기. [1] | 통계린 | 2023.11.22 |
1251 | PSM 매칭변수 숫자 관련 문의입니다. [1] | 오하나 | 2023.11.22 |
1250 | Multiple imputation 관련 질문 및, age adjusted incidence rate 관련 질문을 드립니다. | YSKBH | 2023.11.15 |
1249 | semMediation 설치 재문의드립니다 [3] | 마술샘 | 2023.11.11 |
1248 | 안녕하세요. 정회원 문의 [1] | lionking | 2023.11.06 |
1247 | PSM 관련 질문드립니다. | dr. | 2023.11.05 |
1246 | ggplot [1] | 통계린 | 2023.10.30 |
1245 | 정회원 [1] | 통계린 | 2023.10.29 |
1244 | PSM 관련 질문 드립니다. [2] | 로렌쵸메디치 | 2023.10.25 |
1243 | forest plot 그림이 전체가 다 나오지 않습니다. [1] | joyguni | 2023.10.08 |
1242 | PSM caliper default 값 관련 문의드립니다. [1] | Ooppps | 2023.10.05 |
1241 | reliability test tool,,, [1] | FAdavid | 2023.10.05 |
1240 | 정회원 가입 확인 요청드립니다. [1] | osman | 2023.10.03 |
1239 | 생존분석, cox 회귀 관련 기초적인 질문 입니다. | 만니톨 | 2023.09.27 |
1238 | Twang-mnps에서 매칭된 데이터를 추출하는 방법 좀 알려주세요 | Dorocy | 2023.09.26 |
1237 | 영수증 발급을 부탁드립니다. [1] | 규빈어멈 | 2023.09.26 |
1236 | 정회원 확인 [2] | lionking | 2023.09.24 |
1235 | autoReg 에러 문의드립니다 [1] | 소소 | 2023.09.23 |
1234 | 안녕하세요 에러 관련 문의드립니다 [1] | 화이팅 | 2023.09.19 |