2605.05164v1 May 06, 2026 cs.CV

기하학적 정보를 활용한 상태 공간 모델: 전체 슬라이드 이미지 표현을 위한 새로운 패러다임

Geometry-Aware State Space Model: A New Paradigm for Whole-Slide Image Representation

Sicheng Chen
Sicheng Chen
Citations: 35
h-index: 4
C.P. Wong
C.P. Wong
Citations: 0
h-index: 0
Enhui Chai
Enhui Chai
Citations: 59
h-index: 3
Tianyi Zhang
Tianyi Zhang
Citations: 38
h-index: 2
Kecheng Huang
Kecheng Huang
Citations: 10
h-index: 2
Zeyu Liu
Zeyu Liu
Citations: 17
h-index: 3
Fei Xia
Fei Xia
Citations: 140
h-index: 1

병리 조직 이미지의 정확한 분석은 질병 진단 및 치료 계획에 매우 중요합니다. 전체 슬라이드 이미지(WSI)는 조직 표본을 기가픽셀 해상도로 디지털화한 것으로, 이 과정의 기본 자료이지만, 슬라이드 수준의 예측을 위해서는 수천 개의 패치를 통합해야 합니다. 다중 인스턴스 학습(MIL)은 이러한 문제를 두 단계의 패러다임으로 해결하며, 타일 수준의 임베딩과 슬라이드 수준의 예측을 분리합니다. 그러나 대부분의 기존 방법은 패치 표현을 균일한 유클리드 공간에 임베딩하여, 병리 조직의 계층적 구조 및 지역적 이질성을 간과합니다. 이는 현재 모델의 전반적인 조직 구조 및 미세한 세포 형태를 포착하는 능력을 제한합니다. 이러한 제한점을 해결하기 위해, 우리는 WSI 특징을 이중 기하 공간에 임베딩하는 하이브리드 쌍곡선-유클리드 표현을 도입하여, 계층적 조직 구조와 국소적인 형태적 세부 사항을 상호 보완적으로 모델링할 수 있도록 합니다. 이 형식을 기반으로, 우리는 두 가지 기하 공간을 활용하는 WSI 분류 프레임워크인 BatMIL을 개발했습니다. 수천 개의 패치 간의 장거리 의존성을 모델링하기 위해, 선형 계산 복잡도를 갖는 구조화된 상태 공간 시퀀스 모델(S4)을 사용합니다. 또한, 지역적 이질성을 고려하기 위해, 패치를 영역으로 그룹화하고 이를 전문 서브 네트워크로 동적으로 라우팅하는 chunk-level 혼합 전문가(MoE) 모듈을 도입하여, 표현력을 향상시키면서 불필요한 계산을 줄입니다. 6가지 암 유형에 걸쳐 7개의 WSI 데이터 세트에 대한 광범위한 실험 결과, BatMIL이 슬라이드 수준의 분류 작업에서 최첨단 MIL 접근 방식보다 일관되게 우수한 성능을 보임을 보여줍니다. 이러한 결과는 기하학적 정보를 활용한 표현 학습이 차세대 계산 병리학의 유망한 방향을 제시한다는 것을 시사합니다.

Original Abstract

Accurate analysis of histopathological images is critical for disease diagnosis and treatment planning. Whole-slide images (WSIs), which digitize tissue specimens at gigapixel resolution, are fundamental to this process but require aggregating thousands of patches for slide-level predictions. Multiple Instance Learning (MIL) tackles this challenge with a two-stage paradigm, decoupling tile-level embedding and slide-level prediction. However, most existing methods implicitly embed patch representations in homogeneous Euclidean spaces, overlooking the hierarchical organization and regional heterogeneity of pathological tissues. This limits current models' ability to capture global tissue architecture and fine-grained cellular morphology. To address this limitation, we introduce a hybrid hyperbolic-Euclidean representation that embeds WSI features in dual geometric spaces, enabling complementary modeling of hierarchical tissue structures and local morphological details. Building on this formulation, we develop BatMIL, a WSI classification framework that leverages both geometric spaces. To model long-range dependencies among thousands of patches, we employ a structured state space sequence model (S4) backbone that encodes patch sequences with linear computational complexity. Furthermore, to account for regional heterogeneity, we introduce a chunk-level mixture-of-experts (MoE) module that groups patches into regions and dynamically routes them to specialized subnetworks, improving representational capacity while reducing redundant computation. Extensive experiments on seven WSI datasets spanning six cancer types demonstrate that BatMIL consistently outperforms state-of-the-art MIL approaches in slide-level classification tasks. These results indicate that geometry-aware representation learning offers a promising direction for next-generation computational pathology.

0 Citations
0 Influential
2 Altmetric
10.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!