CoDaS: 웨어러블 센서를 이용한 바이오마커 발굴을 위한 인공지능 협력 데이터 과학자
CoDaS: AI Co-Data-Scientist for Biomarker Discovery via Wearable Sensors
디지털 헬스 분야에서의 과학적 발견은 웨어러블 기기에서 얻은 연속적인 생리학적 신호를 임상적으로 활용 가능한 바이오마커로 변환하는 것을 필요로 합니다. 본 연구에서는 CoDaS(AI Co-Data-Scientist)를 소개합니다. CoDaS는 가설 생성, 통계 분석, 적대적 검증, 문헌 기반 추론을 결합하는 반복적인 프로세스를 통해 바이오마커 발굴을 구조화하는 다중 에이전트 시스템입니다. 본 시스템은 대규모 웨어러블 데이터 세트를 사용하며, 인간의 감독 하에 운영됩니다. 총 9,279명의 참여자를 대상으로 한 세 그룹에서 CoDaS는 정신 건강 관련 41개의 후보 디지털 바이오마커와 대사 관련 25개의 바이오마커를 식별했으며, 각 바이오마커는 재현성, 안정성, 강건성 및 판별력을 평가하는 내부 검증 과정을 거쳤습니다. 두 개의 독립적인 우울증 환자 그룹에서 CoDaS는 두 데이터 세트 모두에서 서식 리듬 불안정성과 관련된 특징을 발견했습니다. 이는 수면 지속 시간 변동성(DWB, ρ= 0.252, p < 0.001) 및 수면 시작 시간 변동성(GLOBEM, ρ= 0.126, p < 0.001)으로 나타났습니다. 대사 관련 그룹에서 CoDaS는 심혈관 적합성 지수(걸음 수/안정 심박수; ρ= -0.374, p < 0.001)를 도출했으며, 이미 알려진 임상적 연관성을 재현했습니다. 여기에는 간 기능 비율(AST/ALT; ρ= -0.375, p < 0.001)이 포함되며, 이는 인슐린 저항성의 알려진 상관관계입니다. CoDaS에서 도출한 특징을 인구 통계 변수와 함께 사용했을 때, 예측 성능이 소폭이지만 꾸준히 향상되었으며, 교차 검증된 ΔR^2 값은 우울증의 경우 0.040, 인슐린 저항성의 경우 0.021 증가했습니다. 이러한 결과는 CoDaS가 대규모 웨어러블 데이터로부터 체계적이고 추적 가능한 가설 생성 및 우선순위 결정을 가능하게 한다는 것을 시사합니다.
Scientific discovery in digital health requires converting continuous physiological signals from wearable devices into clinically actionable biomarkers. We introduce CoDaS (AI Co-Data-Scientist), a multi-agent system that structures biomarker discovery as an iterative process combining hypothesis generation, statistical analysis, adversarial validation, and literature-grounded reasoning with human oversight using large-scale wearable datasets. Across three cohorts totaling 9,279 participant-observations, CoDaS identified 41 candidate digital biomarkers for mental health and 25 for metabolic outcomes, each subjected to an internal validation battery spanning replication, stability, robustness, and discriminative power. Across two independent depression cohorts, CoDaS surfaced circadian instability-related features in both datasets, reflected in sleep duration variability (DWB, ρ= 0.252, p < 0.001) and sleep onset variability (GLOBEM, ρ= 0.126, p < 0.001). In a metabolic cohort, CoDaS derived a cardiovascular fitness index (steps/resting heart rate; ρ= -0.374, p < 0.001), and recovered established clinical associations, including the hepatic function ratio (AST/ALT; ρ= -0.375, p < 0.001), a known correlate of insulin resistance. Incorporating CoDaS-derived features alongside demographic variables led to modest but consistent improvements in predictive performance, with cross-validated ΔR^2 increases of 0.040 for depression and 0.021 for insulin resistance. These findings suggest that CoDaS enables systematic and traceable hypothesis generation and prioritization for biomarker discovery from large-scale wearable data.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.