Skip to menu

Type<-c("K5","K3","K5","K5","소나타","그랜져","I40","소나타","K3","K5")
fuel<-c("디젤","휘발유","전기","디젤","디젤","휘발유","전기","전기","휘발유","디젤")
number<-c("12가3456","12나3456","12다3456","12라3456","12마3456","12바3456","12사3456","12아3456","12자3456","12차3456")
data<-data.frame(Type,fuel,number)   #첫번째 데이터
data<-data%>%mutate(ID=NA) #ID 부분을 temp, temp2, temp3  통해 매치시키기


ID<-c("홍길동","차승원","이기태","한영권","안정민","이기세","원상호","한기태","정지훈","안시훈","이홍철","강원래","고현식","김도영")
number1<-c("12가3456","12나34**","12다34**","12라34**","**마3456","12바3456","12사3456","12아3456","12자3456","12차3456","12카3456","12하3456","12호3456","12허3456")
temp<-data.frame(ID,number1)    #첫번째 임시 데이터

data$ID<-temp$ID[match(data$number,temp$number1)]   #60% 찾음

ID1<-c("홍길동","차승원","이기태","한영권","안정민","이기세","원상호","한기태","정지훈","안시훈","이홍철","강원래","고현식","김도영")
number2<-c("12가3456","12나3456","12다3456","12라3456","**마3456","12바34**","12사34**","12아34**","12자3456","12차3456","12카3456","12하3456","12호3456","12허3456")
temp2<-data.frame(ID1,number2)  #두번째 데이터

data$ID<-temp2$ID1[match(data$number,temp2$number2)] #40% 찾음


#<첫번째 질문>
#data 에 있는 ID변수를 첫번째 임시 데이터에서 60% 정도 찾았습니다.
#못 찾은 데이터는 두번째 임시  데이터에서 40% 찾았습니다. 
#문제는 두번째 임시 데이터에서 찾을때, 첫번째 임시 데이터에서 찾아진 데이터는 덮어쓰기로인해 NA가 됩니다.
#기존에 입력된 ID를 유지하면서 NA로된 데이터를 찾는 방법이 궁금합니다.


ID1<-c("홍길동","차승원","이기태","한영권","안정민","이기세","원상호","한기태","정지훈","안시훈","이홍철","강원래","고현식","김도영")
number2<-c("12가3456","12나3456","12다3456","12라3456","**마3456","12바34**","12사34**","12아34**","12자3456","12차3456","12카3456","12하3456","12호3456","12허3456")
Type1<-c("K5","K3","K5","K5","소나타","그랜져","I40","소나타","K3","K5","K3","소나타","I40","그랜져")
temp3<-data.frame(ID1,number2,Type1)  

data$ID<-temp3$ID1[match(data$Type,data$number,data3$number2,data3$Type1)]

# <두번째 질문>
# 만약 차량번호가 가려져있다면 가려지지않은 차량번호의 일부와 차종으로 차주를 찾고 싶습니다.
# match함수 후 괄호열고 어떤식으로 값을 입력해야 제가 원하는 방법대로 출력이될까요?
# 엑셀은 vlookup함수로 범위를 선택하여 원하는 값을 찾을 수 있던데.. 
# 여러방법 중 merge함수로 해봐도 안되고 더 서치해본 결과 match 함수가 가장 제 요구치에 근접한 함수란 걸 깨달았습니다. 
# 언제나 감사드리고 또 궁금한거 여쭙니다! 
No. Subject Author Date
1094 안녕하세요 r 코드 중에 도저히 해결이 안나는 문제가 있어서 여기에 문의 드립니다 [1] file 슈퍼맨 2022.06.24
1093 Box plot 그리프 설정에 관해 문의합니다. papahong 2022.06.20
1092 cluster data 의 risk difference 에 대해 여쭙고자 합니다. lagrima 2022.06.19
1091 Pair plot을 할 경우 [1] PipeDragoN 2022.06.13
1090 PSM에서 matching 버튼 위치 문의 통계어려워 2022.06.13
1089 PSM (4그룹) 관련 문의드립니다. emksh77 2022.06.08
1088 정회원후원하였습니다. [1] secret rosemary 2022.06.08
1087 PSM 문의 [2] secret sfumatoi 2022.06.07
1086 multipleROC 패키지에서 multivariable의 cutoff 구하기 file 찬쓰 2022.06.07
1085 survival analysis관련 문의 드립니다 [1] cebukim 2022.06.04
1084 autoReg 설치 관련 오류 [5] 닥터강 2022.05.24
1083 survival tree (RPA) 분석 관련 문의 드립니다. [2] 곰곰11 2022.05.23
1082 통계 질문입니다. [1] file 봄봄봄 2022.05.23
1081 데이터 불러오기 문제 [3] strat 2022.04.25
1080 r프로그래밍 문자는 factor로 읽을 수 없나요? [1] file 채채채추ㅐㅊ채야채 2022.04.21
1079 R 코드와 관련하여 문의 드려도 될까요..? [5] file 꾸이뭉 2022.04.19
1078 R 업데이트 후 mytable 함수 에러가 있습니다. [1] 카이토르 2022.04.18
1077 Survival curve 에서 cumulative incidence % 로 표현 가능할까요 [1] nyknicks 2022.04.16
1076 multiple logistic regression test에서 설명변수 선택에 대해 여쭙습니다. [2] file kms9057 2022.04.16
1075 PSM 문의 드립니다 [1] caesar 2022.04.07