AMEND++: 임상 시험의 자격 기준 변경에 대한 벤치마킹
$\texttt{AMEND++}$: Benchmarking Eligibility Criteria Amendments in Clinical Trials
임상 시험의 수정 사항은 종종 지연, 비용 증가 및 행정적 부담을 초래하며, 그 중에서도 자격 기준이 가장 흔하게 수정되는 부분입니다. 본 연구에서는 임상 시험 프로토콜의 초기 자격 기준이 향후 수정될지 예측하는 새로운 자연어 처리(NLP) 과제인 '자격 기준 수정 예측'을 소개합니다. 이 과제를 지원하기 위해, 공개된 임상 시험의 자격 기준 버전 기록과 수정 사항 정보를 담고 있는 두 개의 데이터셋으로 구성된 벤치마크 스위트인 AMEND++을 공개합니다. AMEND++은 AMEND 데이터셋과, LLM 기반의 노이즈 제거 파이프라인을 사용하여 핵심적인 변경 사항만을 포함하도록 정제된 하위 집합인 AMEND_LLM 데이터셋으로 구성됩니다. 또한, 과거 수정 이력을 활용하여 수정에 민감한 표현을 학습하는 '변경 사항 인지 마스크 언어 모델링(CAMLM)'이라는 수정에 대한 인식을 갖춘 사전 학습 전략을 제안합니다. 다양한 기본 모델을 사용한 실험 결과, CAMLM이 일관적으로 수정 예측 성능을 향상시켜, 더욱 안정적이고 비용 효율적인 임상 시험 설계가 가능함을 보여줍니다.
Clinical trial amendments frequently introduce delays, increased costs, and administrative burden, with eligibility criteria being the most commonly amended component. We introduce \textit{eligibility criteria amendment prediction}, a novel NLP task that aims to forecast whether the eligibility criteria of an initial trial protocol will undergo future amendments. To support this task, we release $\texttt{AMEND++}$, a benchmark suite comprising two datasets: $\texttt{AMEND}$, which captures eligibility-criteria version histories and amendment labels from public clinical trials, and $\verb|AMEND_LLM|$, a refined subset curated using an LLM-based denoising pipeline to isolate substantive changes. We further propose $\textit{Change-Aware Masked Language Modeling}$ (CAMLM), a revision-aware pretraining strategy that leverages historical edits to learn amendment-sensitive representations. Experiments across diverse baselines show that CAMLM consistently improves amendment prediction, enabling more robust and cost-effective clinical trial design.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.