엘리트 여성 축구 선수들의 부상 발생 예측: DeepHit 기반 생존 분석 접근 방식
Time-to-Injury Forecasting in Elite Female Football: A DeepHit Survival Approach
축구에서 발생하는 부상은 선수와 팀에 개인적, 경쟁적, 그리고 재정적 영향을 미치는 심각한 문제입니다. 머신러닝은 과거에 부상 예측에 활용되었지만, 기존 방법들은 종종 고정된 사전 시즌 데이터와 이진 결과에 의존하여 실제 적용에 한계가 있었습니다. 본 연구에서는 DeepHit 신경망을 사용하여 장기간의 선수 모니터링 데이터를 기반으로 부상 발생 시점을 예측하는 것을 조사하고, 동시에 해석 가능한 예측을 제공하는 것을 목표로 합니다. 분석에는 공개된 SoccerMon 데이터 세트가 사용되었으며, 이 데이터 세트에는 엘리트 여성 축구 선수들의 두 시즌에 걸친 훈련, 경기, 그리고 건강 관련 기록이 포함되어 있습니다. 데이터는 전처리 과정을 거쳐 정제, 특징 추출, 그리고 세 가지의 대체 전략을 적용했습니다. 벤치마킹을 위해 랜덤 포레스트, XGBoost, 로지스틱 회귀 모델과 같은 기본 모델을 그리드 검색을 통해 최적화했으며, 다층 퍼셉트론을 기반으로 구현된 DeepHit 모델은 시간 순서 및 플레이어별 교차 검증을 통해 평가되었습니다. DeepHit 모델은 0.762의 일치 지수를 달성하여 기본 모델보다 우수한 성능을 보였으며, 개별 선수에 대한 시간 변화에 따른 위험도를 제공했습니다. Shapley Additive Explanations (SHAP) 분석은 기존의 위험 요인과 일관된 임상적으로 중요한 예측 변수를 식별하여 해석 가능성을 향상시켰습니다. 전반적으로, 본 연구는 새로운 개념 증명을 제공합니다. DeepHit 기반 생존 모델링은 축구에서의 부상 예측을 발전시킬 수 있는 강력한 잠재력을 가지고 있으며, 경쟁 수준 전반에 걸쳐 부상 예방을 위한 정확하고, 설명 가능하며, 실행 가능한 통찰력을 제공할 수 있습니다.
Injury occurrence in football poses significant challenges for athletes and teams, carrying personal, competitive, and financial consequences. While machine learning has been applied to injury prediction before, existing approaches often rely on static pre-season data and binary outcomes, limiting their real-world utility. This study investigates the feasibility of using a DeepHit neural network to forecast time-to-injury from longitudinal athlete monitoring data, while providing interpretable predictions. The analysis utilised the publicly available SoccerMon dataset, containing two seasons of training, match, and wellness records from elite female footballers. Data was pre-processed through cleaning, feature engineering, and the application of three imputation strategies. Baseline models (Random Forest, XGBoost, Logistic Regression) were optimised via grid search for benchmarking, while the DeepHit model, implemented with a multilayer perceptron backbone, was evaluated using chronological and leave-one-player-out (LOPO) validation. DeepHit achieved a concordance index of 0.762, outperforming baseline models and delivering individualised, time-varying risk estimates. Shapley Additive Explanations (SHAP) identified clinically relevant predictors consistent with established risk factors, enhancing interpretability. Overall, this study provides a novel proof of concept: survival modelling with DeepHit shows strong potential to advance injury forecasting in football, offering accurate, explainable, and actionable insights for injury prevention across competitive levels.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.