2603.12719v1 Mar 13, 2026 cs.CV

IGASA: 통합 기하 정보 인식 및 건너뛰기 주의 메커니즘을 활용한 포인트 클라우드 정합 성능 향상

IGASA: Integrated Geometry-Aware and Skip-Attention Modules for Enhanced Point Cloud Registration

Dongxu Zhang
Dongxu Zhang
Citations: 65
h-index: 6
Wenbiao Yan
Wenbiao Yan
Citations: 70
h-index: 5
Peilin Fan
Peilin Fan
Citations: 13
h-index: 2
Jihua Zhu
Jihua Zhu
Citations: 150
h-index: 6
Shiqi Li
Shiqi Li
Citations: 82
h-index: 6
Haoran Xu
Haoran Xu
Citations: 9
h-index: 2
Huimin Lu
Huimin Lu
Citations: 329
h-index: 10

포인트 클라우드 정합(PCR)은 3차원 컴퓨터 비전 분야의 핵심적인 기술이며, 자율 주행, 로봇 공학, 환경 모델링 등 다양한 응용 분야에서 필수적인 역할을 수행합니다. 그러나 기존의 방법들은 실제 환경에서 발생하는 심각한 노이즈, 상당한 가려짐, 그리고 큰 규모의 변형과 같은 문제에 직면했을 때 종종 실패합니다. 이러한 한계는 복잡한 환경에서 정합 정확도를 저하시키고, 안정성을 떨어뜨리는 원인이 됩니다. 본 논문에서는, 견고한 다중 스케일 특징 추출 및 융합을 위한 계층적 피라미드 아키텍처(HPA)를 기반으로 하는 새로운 정합 프레임워크인 IGASA를 제안합니다. IGASA는 계층적 크로스-레이어 어텐션(HCLA) 모듈과 반복적인 기하 정보 인식 정제(IGAR) 모듈이라는 두 가지 핵심 구성 요소를 통합합니다. HCLA 모듈은 건너뛰기 주의 메커니즘을 활용하여 다중 해상도 특징을 정렬하고, 지역적인 기하 정보의 일관성을 향상시킵니다. 동시에, IGAR 모듈은 초기 정합 과정에서 확립된 신뢰할 수 있는 대응점을 활용하여 정밀한 정합을 수행합니다. 이러한 시너지 효과를 통해 IGASA는 다양한 포인트 클라우드 구조와 복잡한 변형에 효과적으로 적응할 수 있습니다. IGASA의 성능을 3D(Lo)Match, KITTI, 그리고 nuScenes를 포함한 네 가지 널리 사용되는 벤치마크 데이터셋에서 평가했습니다. 광범위한 실험 결과, IGASA는 기존의 최첨단 방법들을 능가하며, 정합 정확도 측면에서 상당한 개선을 보였습니다. 본 연구는 포인트 클라우드 정합 기술 발전에 견고한 기반을 제공하며, 실제 3차원 컴퓨터 비전 응용 분야에 대한 귀중한 통찰력을 제공합니다. IGASA의 코드는 다음 GitHub 저장소에서 확인할 수 있습니다: [https://github.com/DongXu-Zhang/IGASA](https://github.com/DongXu-Zhang/IGASA)}

Original Abstract

Point cloud registration (PCR) is a fundamental task in 3D vision and provides essential support for applications such as autonomous driving, robotics, and environmental modeling. Despite its widespread use, existing methods often fail when facing real-world challenges like heavy noise, significant occlusions, and large-scale transformations. These limitations frequently result in compromised registration accuracy and insufficient robustness in complex environments. In this paper, we propose IGASA as a novel registration framework constructed upon a Hierarchical Pyramid Architecture (HPA) designed for robust multi-scale feature extraction and fusion. The framework integrates two pivotal components consisting of the Hierarchical Cross-Layer Attention (HCLA) module and the Iterative Geometry-Aware Refinement (IGAR) module. The HCLA module utilizes skip attention mechanisms to align multi-resolution features and enhance local geometric consistency. Simultaneously, the IGAR module is designed for the fine matching phase by leveraging reliable correspondences established during coarse matching. This synergistic integration within the architecture allows IGASA to adapt effectively to diverse point cloud structures and intricate transformations. We evaluate the performance of IGASA on four widely recognized benchmark datasets including 3D(Lo)Match, KITTI, and nuScenes. Our extensive experiments consistently demonstrate that IGASA significantly surpasses state-of-the-art methods and achieves notable improvements in registration accuracy. This work provides a robust foundation for advancing point cloud registration techniques while offering valuable insights for practical 3D vision applications. The code for IGASA is available in \href{https://github.com/DongXu-Zhang/IGASA}{https://github.com/DongXu-Zhang/IGASA}.

7 Citations
0 Influential
33.047189562171 Altmetric
172.2 Score
Original PDF
4

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!