이전 글에 이어서 이번 글에서는 해외의 콤팩트 시티의 데이터를 사용해 시계열 예측을 하는 모델을 만들어 볼 것입니다. 먼저 예측을 위해 데이터를 8:2의 비율로 나눠줍니다.#train:test = 8:2train_size 그다음 xgboost를 사용하기 위해 라벨링과 matrix 형태로 변환 시켜줍니다.#train 데이터 라벨링train_label % select(-c(pm25, date))#test 데이터 라벨링test_label % select(-c(pm25, date))#xgboost를 위해 matrix 형태로 바꿔주고 xgb.DMatrix를 사용해 모델에 적합한 형태로 변환train_xgb 최적의 하이퍼 파라미터 값을 추정하기 위해 random search를 진행합니다. 이 과정에서 시간이 오..