OPGAgent: 치과 파노라마 X-선 영상 판독을 위한 감사 기능이 탑재된 에이전트
OPGAgent: An Agent for Auditable Dental Panoramic X-ray Interpretation
오르토판토그램(OPG)은 치과에서 전체 구강 스크리닝을 위해 사용되는 표준 파노라마 방사선 사진입니다. 최근의 비전-언어 모델(VLM)은 자연어 처리를 통해 다중 작업을 수행할 수 있지만, 대부분의 개별 작업에서는 특정 작업에 특화된 모델보다 성능이 떨어집니다. 특수 도구를 조정하는 에이전트 기반 시스템은 다양성과 정확성을 모두 제공할 수 있는 가능성을 제시하지만, 이러한 접근 방식은 치과 영상 분야에서 아직 탐구되지 않았습니다. 이러한 격차를 해결하기 위해, 우리는 감사 기능이 탑재된 OPG 해석을 위한 다중 도구 에이전트 시스템인 OPGAgent를 제안합니다. OPGAgent는 세 가지 구성 요소를 통해 특수 인지 모듈을 조정하고 합의 메커니즘을 사용합니다. (1) 계층적 증거 수집 모듈은 동적으로 도구를 호출하여 OPG 분석을 전체, 사분면 및 치아 수준 단계로 분해합니다. (2) 전문 도구 상자는 공간, 탐지, 유틸리티 및 전문가 도구 모음을 포함합니다. (3) 합의 하위 에이전트는 해부학적 제약을 통해 충돌을 해결합니다. 또한, 우리는 실제 임상 보고서에서 파생된 (위치, 필드, 값) 튜플을 기반으로 하는 구조화된 보고서 프로토콜인 OPG-Bench를 제안합니다. 이를 통해 발견 사항과 환각에 대한 종합적인 검토가 가능하며, VQA 지표의 한계를 뛰어넘을 수 있습니다. 당사의 OPG-Bench와 공개된 MMOral-OPG 벤치마크에서, OPGAgent는 기존의 치과 VLM 및 의료 에이전트 프레임워크보다 구조화된 보고서 및 VQA 평가 모두에서 더 뛰어난 성능을 보입니다. 논문 채택 시 코드를 공개할 예정입니다.
Orthopantomograms (OPGs) are the standard panoramic radiograph in dentistry, used for full-arch screening across multiple diagnostic tasks. While Vision Language Models (VLMs) now allow multi-task OPG analysis through natural language, they underperform task-specific models on most individual tasks. Agentic systems that orchestrate specialized tools offer a path to both versatility and accuracy, this approach remains unexplored in the field of dental imaging. To address this gap, we propose OPGAgent, a multi-tool agentic system for auditable OPG interpretation. OPGAgent coordinates specialized perception modules with a consensus mechanism through three components: (1) a Hierarchical Evidence Gathering module that decomposes OPG analysis into global, quadrant, and tooth-level phases with dynamically invoking tools, (2) a Specialized Toolbox encapsulating spatial, detection, utility, and expert zoos, and (3) a Consensus Subagent that resolves conflicts through anatomical constraints. We further propose OPG-Bench, a structured-report protocol based on (Location, Field, Value) triples derived from real clinical reports, which enables a comprehensive review of findings and hallucinations, extending beyond the limitations of VQA indicators. On our OPG-Bench and the public MMOral-OPG benchmark, OPGAgent outperforms current dental VLMs and medical agent frameworks across both structured-report and VQA evaluation. Code will be released upon acceptance.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.