MARCH: CT 보고서 생성 시스템을 위한 다중 에이전트 기반 의료 영상 보고 계층 구조
MARCH: Multi-Agent Radiology Clinical Hierarchy for CT Report Generation
자동화된 3차원 의료 영상 보고서 생성은 종종 임상적 오류를 포함하며, 인간의 실무에서 나타나는 반복적인 검증 과정을 부족하게 합니다. 최근의 시각-언어 모델(VLM)은 해당 분야를 발전시켰지만, 일반적으로 협력적인 감독 없이 작동하는 단일 '블랙박스' 시스템으로, 임상 워크플로우의 특성을 벗어납니다. 이러한 문제점을 해결하기 위해, 우리는 MARCH(Multi-Agent Radiology Clinical Hierarchy, 다중 에이전트 기반 의료 영상 보고 계층 구조)를 제안합니다. MARCH는 방사선과 부서의 전문적인 계층 구조를 모방하고, 각 에이전트에게 특화된 역할을 부여하는 다중 에이전트 프레임워크입니다. MARCH는 다중 척도 CT 특징 추출을 통해 초기 초안을 작성하는 레지던트 에이전트, 검색 기반 수정 작업을 수행하는 여러 명의 펠로우 에이전트, 그리고 진단 불일치를 해결하기 위해 반복적이고 입장 기반의 합의 과정을 조율하는 어텐딩 에이전트를 사용합니다. RadGenome-ChestCT 데이터셋에서 MARCH는 최첨단 기준 모델보다 임상적 정확성과 언어적 정확성 모두에서 현저하게 뛰어난 성능을 보였습니다. 우리의 연구는 인간과 유사한 조직 구조를 모델링함으로써, 고위험 의료 분야에서 인공지능의 신뢰성을 향상시킬 수 있음을 보여줍니다.
Automated 3D radiology report generation often suffers from clinical hallucinations and a lack of the iterative verification found in human practice. While recent Vision-Language Models (VLMs) have advanced the field, they typically operate as monolithic "black-box" systems without the collaborative oversight characteristic of clinical workflows. To address these challenges, we propose MARCH (Multi-Agent Radiology Clinical Hierarchy), a multi-agent framework that emulates the professional hierarchy of radiology departments and assigns specialized roles to distinct agents. MARCH utilizes a Resident Agent for initial drafting with multi-scale CT feature extraction, multiple Fellow Agents for retrieval-augmented revision, and an Attending Agent that orchestrates an iterative, stance-based consensus discourse to resolve diagnostic discrepancies. On the RadGenome-ChestCT dataset, MARCH significantly outperforms state-of-the-art baselines in both clinical fidelity and linguistic accuracy. Our work demonstrates that modeling human-like organizational structures enhances the reliability of AI in high-stakes medical domains.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.