2604.16848v1 Apr 18, 2026 cs.CV

TowerDataset: 글로벌-로컬 융합 프레임워크를 활용한 전력선 통로 분할을 위한 이질적 벤치마크

TowerDataset: A Heterogeneous Benchmark for Transmission Corridor Segmentation with a Global-Local Fusion Framework

Zhaobo Qi
Zhaobo Qi
Citations: 173
h-index: 7
Xinyan Liu
Xinyan Liu
Citations: 32
h-index: 3
Weigang Zhang
Weigang Zhang
Citations: 18
h-index: 3
Xuean Cui
Xuean Cui
Citations: 2
h-index: 1
Beichen Zang
Beichen Zang
Citations: 0
h-index: 0
Chen Yang
Chen Yang
Citations: 28
h-index: 3
Antoni B. Chan
Antoni B. Chan
Citations: 17
h-index: 1

전력선 검사를 위한 정밀한 의미 분할은 전력선 지점 클라우드를 기반으로 수행되며 매우 중요합니다. 그러나 현재의 연구는 현실적인 데이터 부족과 긴, 이질적인 장면에서 글로벌 통로 구조와 로컬 기하학적 세부 사항을 모델링하는 어려움으로 인해 제한적입니다. 기존의 공개 데이터셋은 대부분 몇 가지 거친 카테고리 또는 짧게 잘린 장면만을 제공하며, 이는 장거리 구조적 의존성, 심각한 불균형 데이터 분포, 그리고 안전에 중요한 구성 요소 간의 미묘한 차이를 간과합니다. 그 결과, 현재의 방법들은 현실적인 검사 환경에서 평가하기 어렵고, 상호 보완적인 글로벌 및 로컬 정보를 유지하고 통합하는 능력은 불분명합니다. 이러한 문제점을 해결하기 위해, 전력선 통로 분할을 위한 이질적인 벤치마크인 TowerDataset을 소개합니다. TowerDataset은 661개의 실제 장면과 약 24억 6천6백만 개의 지점 데이터를 포함하고 있으며, 긴 통로의 전체 범위를 보존하고, 세분화된 22개의 클래스 분류 체계를 정의하며, 표준화된 분할 및 평가 프로토콜을 제공합니다. 또한, 전체 장면 및 로컬 세부 정보를 유지하고 융합하는 글로벌-로컬 융합 프레임워크를 제시합니다. NoCrop 학습 및 프로토타입 대비 학습을 사용하는 전체 장면 분기는 장거리 토폴로지 및 컨텍스트 의존성을 파악합니다. 블록 기반의 로컬 분기는 미세한 기하학적 구조를 유지합니다. 두 분기의 예측 결과는 기하학적 검증을 통해 융합되고 개선됩니다. 이러한 설계는 모델이 희귀하고 혼동되는 구성 요소를 인식할 때 글로벌 관계와 로컬 모양 세부 정보를 모두 활용할 수 있도록 합니다. TowerDataset 및 두 개의 공개 벤치마크에 대한 실험 결과는 제안된 벤치마크의 어려움을 보여주고, 제안된 프레임워크가 실제의 복잡하고 이질적인 전력선 통로 장면에서 얼마나 견고한지를 입증합니다. 데이터셋은 곧 다음 주소에서 공개될 예정입니다: https://huggingface.co/datasets/tccx18/Towerdataset/tree/main.

Original Abstract

Fine-grained semantic segmentation of transmission-corridor point clouds is fundamental for intelligent power-line inspection. However, current progress is limited by realistic data scarcity and the difficulty of modeling global corridor structure and local geometric details in long, heterogeneous scenes. Existing public datasets usually provide only a few coarse categories or short cropped scenes which overlook long-range structural dependencies, severe long-tail distributions, and subtle distinctions among safety-critical components. As a result, current methods are difficult to evaluate under realistic inspection settings, and their ability to preserve and integrate complementary global and local cues remains unclear. To address the above challenges, we introduce TowerDataset, a heterogeneous benchmark for transmission-corridor segmentation. TowerDataset contains 661 real-world scenes and about 2.466 billion points. It preserves long corridor extents, defines a fine-grained 22-class taxonomy, and provides standardized splits and evaluation protocols. In addition, we present a global-local fusion framework which preserves and fuses whole-scene and local-detail information. A whole-scene branch with NoCrop training and prototypical contrastive learning captures long-range topology and contextual dependencies. A block-wise local branch retains fine geometric structures. Both predictions are then fused and refined by geometric validation. This design allows the model to exploit both global relationships and local shape details when recognizing rare and confusing components. Experiments on TowerDataset and two public benchmarks demonstrate the challenge of the proposed benchmark and the robustness of our framework in real, complex, and heterogeneous transmission-corridor scenes. The dataset will be released soon at https://huggingface.co/datasets/tccx18/Towerdataset/tree/main.

0 Citations
0 Influential
23.5 Altmetric
117.5 Score
Original PDF
0

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!