HQF-Net: 원격 감지 이미지 분할을 위한 하이브리드 양자-고전 다중 스케일 융합 네트워크
HQF-Net: A Hybrid Quantum-Classical Multi-Scale Fusion Network for Remote Sensing Image Segmentation
원격 감지 의미론적 분할은 복잡한 장면에서 미세한 공간적 세부 사항과 고수준의 의미론적 맥락을 동시에 포착할 수 있는 모델을 요구합니다. U-Net과 같은 기존 인코더-디코더 아키텍처는 여전히 강력한 기준선이지만, 종종 전역 의미론과 구조화된 특징 상호 작용을 완전히 활용하는 데 어려움을 겪습니다. 본 연구에서는 원격 감지 이미지 분할을 위한 하이브리드 양자-고전 다중 스케일 융합 네트워크인 HQF-Net을 제안합니다. HQF-Net은 고정된 DINOv3 ViT-L/16 백본에서 제공되는 다중 스케일 의미론적 지침을 사용자 정의된 U-Net 아키텍처와 변형 가능한 다중 스케일 크로스-어텐션 융합(DMCAF) 모듈을 통해 통합합니다. 또한, 특징 정밀도를 향상시키기 위해 양자 강화 스킵 연결(QSkip)과 혼합 전문가(QMoE)를 갖춘 양자 병목 구조를 도입합니다. 제안된 디자인은 세 가지 원격 감지 벤치마크에서 일관된 성능 향상을 보여줍니다. HQF-Net은 LandCover.ai에서 0.8568의 mIoU와 96.87%의 전체 정확도를, OpenEarthMap에서 71.82%의 mIoU를, SeasoNet에서 55.28%의 mIoU와 99.37%의 전체 정확도를 달성했습니다. 또한, 아키텍처 분석 연구를 통해 각 주요 구성 요소의 기여도를 확인했습니다. 이러한 결과는 구조화된 하이브리드 양자-고전 특징 처리가 단기적인 양자 제약 조건 하에서 원격 감지 의미론적 분할을 개선하는 데 유망한 방향임을 보여줍니다.
Remote sensing semantic segmentation requires models that can jointly capture fine spatial details and high-level semantic context across complex scenes. While classical encoder-decoder architectures such as U-Net remain strong baselines, they often struggle to fully exploit global semantics and structured feature interactions. In this work, we propose HQF-Net, a hybrid quantum-classical multi-scale fusion network for remote sensing image segmentation. HQF-Net integrates multi-scale semantic guidance from a frozen DINOv3 ViT-L/16 backbone with a customized U-Net architecture through a Deformable Multiscale Cross-Attention Fusion (DMCAF) module. To enhance feature refinement, the framework further introduces quantum-enhanced skip connections (QSkip) and a Quantum bottleneck with Mixture-of-Experts (QMoE), which combines complementary local, global, and directional quantum circuits within an adaptive routing mechanism. Experiments on three remote sensing benchmarks show consistent improvements with the proposed design. HQF-Net achieves 0.8568 mIoU and 96.87% overall accuracy on LandCover.ai, 71.82% mIoU on OpenEarthMap, and 55.28% mIoU with 99.37% overall accuracy on SeasoNet. An architectural ablation study further confirms the contribution of each major component. These results show that structured hybrid quantum-classical feature processing is a promising direction for improving remote sensing semantic segmentation under near-term quantum constraints.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.