2601.12715v1 Jan 19, 2026 cs.CV

RSOD: 신뢰성 기반 소나 이미지 객체 탐지 - 극히 제한된 레이블 데이터 환경

RSOD: Reliability-Guided Sonar Image Object Detection with Extremely Limited Labels

P. Guo
P. Guo
Citations: 8
h-index: 1
Chengzhou Li
Chengzhou Li
Citations: 14
h-index: 2
Guanchen Meng
Guanchen Meng
Citations: 1
h-index: 1
Qi Jia
Qi Jia
Citations: 54
h-index: 3
Jinyuan Liu
Jinyuan Liu
Citations: 4,123
h-index: 26
Zhu Liu
Zhu Liu
Citations: 2
h-index: 1
Xiaokang Liu
Xiaokang Liu
Citations: 2
h-index: 1
Yu Liu
Yu Liu
Citations: 1,680
h-index: 21
Zhongxuan Luo
Zhongxuan Luo
Citations: 2,362
h-index: 13
Xin Fan
Xin Fan
Citations: 88
h-index: 2

소나 이미지 객체 탐지는 수중 탐지 시스템의 핵심 기술입니다. 자연 이미지와 달리, 소나 이미지는 텍스처 디테일이 부족하고 노이즈에 더 민감하여, 전문가가 아닌 사용자가 클래스 간의 미묘한 차이를 구별하기 어렵습니다. 이는 소나 이미지에 대한 정확한 어노테이션 데이터를 제공하는 데 어려움을 야기합니다. 따라서, 극히 제한된 레이블 데이터 환경에서 효과적인 객체 탐지 방법을 설계하는 것은 매우 중요합니다. 이러한 문제를 해결하기 위해, 우리는 소나 이미지의 특징을 최대한 학습하고, 제한된 레이블 데이터의 영향을 완화하기 위한 적절한 의사 레이블 전략을 개발하는 가이드-학생 프레임워크인 RSOD를 제안합니다. 먼저, RSOD는 교사의 예측 결과를 다양한 관점에서 평가하여 신뢰도 점수를 계산합니다. 이 점수를 활용하기 위해, 우리는 소나 이미지의 제한된 레이블 데이터 부족 문제를 해결하기 위한 객체 혼합 의사 레이블 방법을 도입했습니다. 마지막으로, 우리는 신뢰성을 기반으로 하는 적응적 제약을 구현하여 학생 모델의 성능을 최적화했습니다. RSOD는 비레이블 데이터를 최대한 활용하여, 극히 제한된 레이블 데이터 환경에서도 우수한 성능을 발휘합니다. 특히, UATD 데이터셋에서, 우리의 방법은 전체 레이블 데이터의 5%만을 사용하여, 100% 레이블 데이터로 학습된 기준 알고리즘과 경쟁할 수 있는 결과를 얻었습니다. 또한, 우리는 소나 분야 연구에 더 가치 있는 데이터를 제공하기 위해 새로운 데이터셋을 수집했습니다.

Original Abstract

Object detection in sonar images is a key technology in underwater detection systems. Compared to natural images, sonar images contain fewer texture details and are more susceptible to noise, making it difficult for non-experts to distinguish subtle differences between classes. This leads to their inability to provide precise annotation data for sonar images. Therefore, designing effective object detection methods for sonar images with extremely limited labels is particularly important. To address this, we propose a teacher-student framework called RSOD, which aims to fully learn the characteristics of sonar images and develop a pseudo-label strategy suitable for these images to mitigate the impact of limited labels. First, RSOD calculates a reliability score by assessing the consistency of the teacher's predictions across different views. To leverage this score, we introduce an object mixed pseudo-label method to tackle the shortage of labeled data in sonar images. Finally, we optimize the performance of the student by implementing a reliability-guided adaptive constraint. By taking full advantage of unlabeled data, the student can perform well even in situations with extremely limited labels. Notably, on the UATD dataset, our method, using only 5% of labeled data, achieves results that can compete against those of our baseline algorithm trained on 100% labeled data. We also collected a new dataset to provide more valuable data for research in the field of sonar.

0 Citations
0 Influential
13 Altmetric
65.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!