본문 바로가기

공모전

(3)
AMP®-Parkinson's Disease Progression Prediction 공모전 (3) 공모전 제출을 하며 겪었던 시행착오들에 대해 설명하려한다. 1. 모델 선정 updrs에 대하여 모델에 따라 1,3 또는 2,4의 SMAPE 점수가 과도하게 높아지는 경향이 있었다. 따라서 2개의 모델을 사용하여 ensemble을 통해 학습을 진행하였고, 여기에서 updrs 파트 1과 3은 XGBRegressor로 학습, updrs 2와 4를 RandomForestRegressor로 학습을 진행하였다. 2. 런타임 모델을 한 번 돌릴 때마다 colab에서는 런타임이 강제로 종료되는 경우가 발생하였으며, kaggle notebook에서는 런타임 강제 종료 문제는 해결되었으나 시간이 오래 걸렸다. 코드를 모두 돌려보는데 1시간 가량 사용되었으며 대회에 코드를 제출할 때 걸리는 시간은 길게는 3시간까지 소요되었..
AMP®-Parkinson's Disease Progression Prediction 공모전 (2) 본격적인 공모전 준비에 앞서 홈페이지에 공유되어 있는 코드와 EDA 과정을 분석해보며 아이디어를 구체화시키려 한다. 학습 모델에 대한 분석은 다음 글에서 할 예정이며 이번에는 data EDA를 주로 살펴본다. 1. AMP - EDA + Models https://www.kaggle.com/code/craigmthomas/amp-eda-models 에 공유되어있는 코드를 분석하려 한다. 1.1 Initial Impressions import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import gc import warnings warnings.filterwarnings('ignore') trai..
AMP®-Parkinson's Disease Progression Prediction 공모전 (1) 1. 공모전 소개 Kaggle에서 주관하는 AMP®-Parkinson's Disease Progression Prediction 공모전은 2023.03.12~2023.05.18일까지 진행되며, 단백질과 펩타이드 데이터를 통해 파킨슨병 환자의 질병 진행을 예측하는 것이 목표이다. https://www.kaggle.com/competitions/amp-parkinsons-disease-progression-prediction 2. 공모전 목표 이 대회에서는 MDS-UPDRS점수를 통해 질병 예측을 하려고 한다. 여기서 MDS-UPDRS란 The Movement Disorder Society(이하 MDS)에서 지원하는 Unified Parkinson Disease Rating Scale(이하 UPDRS)로 총..