이번 글에서는 유명한 데이터 분석 중 하나인 kaggle의 titanic 생존자 예측을 해보도록 하겠습니다. R을 이용한 타이타닉 생존자 예측을 검색해 보면 대부분의 글이 Random Forest나 Logistic Regression을 사용하는 것을 확인할 수 있습니다.따라서, 여기서는 Xgboost를 이용하여 예측을 진행하겠습니다. Xgboost는 의사결정 나무 모형을 기반으로 하는 모델입니다. 앞서 설명한 Random Forest도 의사결정 나무 모형을 기반으로 하는 모델입니다. 다만, Random Forest와 달리 Xgboost는 부스팅 기법을 적용하여 더 효율적인 평가를 내려 더 나은 결과를 제공합니다. Random Forest와 Xgboost 사이에는 Gradient Boosting이라는 모..