2603.00462v1 Feb 28, 2026 cs.CV

OPGAgent: 치과 파노라마 X-선 영상 판독을 위한 감사 기능이 탑재된 에이전트

OPGAgent: An Agent for Auditable Dental Panoramic X-ray Interpretation

Ming Hu
Ming Hu
Citations: 233
h-index: 9
Zhaolin Yu
Zhaolin Yu
Citations: 0
h-index: 0
Litao Yang
Litao Yang
Citations: 84
h-index: 2
Ben Babicka
Ben Babicka
Citations: 0
h-index: 0
Jing Hao
Jing Hao
Citations: 50
h-index: 4
Anthony Huang
Anthony Huang
Citations: 9
h-index: 2
J. Huang
J. Huang
Citations: 2,981
h-index: 2
Yueming Jin
Yueming Jin
Citations: 291
h-index: 8
Jiasong Wu
Jiasong Wu
Citations: 29
h-index: 3
Zongyuan Ge
Zongyuan Ge
Citations: 243
h-index: 8

오르토판토그램(OPG)은 치과에서 전체 구강 스크리닝을 위해 사용되는 표준 파노라마 방사선 사진입니다. 최근의 비전-언어 모델(VLM)은 자연어 처리를 통해 다중 작업을 수행할 수 있지만, 대부분의 개별 작업에서는 특정 작업에 특화된 모델보다 성능이 떨어집니다. 특수 도구를 조정하는 에이전트 기반 시스템은 다양성과 정확성을 모두 제공할 수 있는 가능성을 제시하지만, 이러한 접근 방식은 치과 영상 분야에서 아직 탐구되지 않았습니다. 이러한 격차를 해결하기 위해, 우리는 감사 기능이 탑재된 OPG 해석을 위한 다중 도구 에이전트 시스템인 OPGAgent를 제안합니다. OPGAgent는 세 가지 구성 요소를 통해 특수 인지 모듈을 조정하고 합의 메커니즘을 사용합니다. (1) 계층적 증거 수집 모듈은 동적으로 도구를 호출하여 OPG 분석을 전체, 사분면 및 치아 수준 단계로 분해합니다. (2) 전문 도구 상자는 공간, 탐지, 유틸리티 및 전문가 도구 모음을 포함합니다. (3) 합의 하위 에이전트는 해부학적 제약을 통해 충돌을 해결합니다. 또한, 우리는 실제 임상 보고서에서 파생된 (위치, 필드, 값) 튜플을 기반으로 하는 구조화된 보고서 프로토콜인 OPG-Bench를 제안합니다. 이를 통해 발견 사항과 환각에 대한 종합적인 검토가 가능하며, VQA 지표의 한계를 뛰어넘을 수 있습니다. 당사의 OPG-Bench와 공개된 MMOral-OPG 벤치마크에서, OPGAgent는 기존의 치과 VLM 및 의료 에이전트 프레임워크보다 구조화된 보고서 및 VQA 평가 모두에서 더 뛰어난 성능을 보입니다. 논문 채택 시 코드를 공개할 예정입니다.

Original Abstract

Orthopantomograms (OPGs) are the standard panoramic radiograph in dentistry, used for full-arch screening across multiple diagnostic tasks. While Vision Language Models (VLMs) now allow multi-task OPG analysis through natural language, they underperform task-specific models on most individual tasks. Agentic systems that orchestrate specialized tools offer a path to both versatility and accuracy, this approach remains unexplored in the field of dental imaging. To address this gap, we propose OPGAgent, a multi-tool agentic system for auditable OPG interpretation. OPGAgent coordinates specialized perception modules with a consensus mechanism through three components: (1) a Hierarchical Evidence Gathering module that decomposes OPG analysis into global, quadrant, and tooth-level phases with dynamically invoking tools, (2) a Specialized Toolbox encapsulating spatial, detection, utility, and expert zoos, and (3) a Consensus Subagent that resolves conflicts through anatomical constraints. We further propose OPG-Bench, a structured-report protocol based on (Location, Field, Value) triples derived from real clinical reports, which enables a comprehensive review of findings and hallucinations, extending beyond the limitations of VQA indicators. On our OPG-Bench and the public MMOral-OPG benchmark, OPGAgent outperforms current dental VLMs and medical agent frameworks across both structured-report and VQA evaluation. Code will be released upon acceptance.

0 Citations
0 Influential
4.5 Altmetric
22.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!