숨바꼭질: 지구 관측 이미지의 중복성 연구
Hide and Seek: Investigating Redundancy in Earth Observation Imagery
지구 관측(EO) 데이터의 가용성 증가와 컴퓨터 비전 분야의 최근 발전은 지구 관측 분야의 머신러닝 발전에 크게 기여하여, 점점 더 큰 규모의 특화된 모델을 개발하는 데 영향을 미쳤습니다. 그러나 이러한 발전은 지구 관측 데이터의 다른 분야와 구별되는 기본적인 특성을 간과할 위험이 있습니다. 우리는 지구 관측 데이터가 스펙트럼, 시간, 공간 및 의미적 중복성을 포함하는 다차원적 중복성을 가지고 있으며, 이는 현재 문헌에서 나타나는 것보다 지구 관측 분야와 그 응용 분야에 더 큰 영향을 미친다고 주장합니다. 이 가설을 검증하기 위해, 지구 관측 데이터의 다양한 측면에서 이 현상의 존재, 일관성 및 실질적인 의미를 체계적으로 조사했습니다. 우리의 연구 결과는 지구 관측 데이터의 중복성이 상당하고 광범위하게 존재하며, 이를 활용하면 훈련 및 추론 과정에서 계산 비용을 줄이면서(약 4배 감소) 기준 성능과 거의 동일한 성능(약 98.5%)을 얻을 수 있음을 확인했습니다. 더욱 중요한 점은 이러한 성능 향상이 작업, 지리적 위치, 센서, 지상 샘플링 거리 및 아키텍처 설계에 걸쳐 일관되게 나타나므로, 다면적인 중복성은 특정 실험 선택의 산물이 아니라 지구 관측 데이터의 구조적인 특성임을 시사합니다. 이러한 결과는 더욱 효율적이고 확장 가능하며 접근성이 뛰어난 대규모 지구 관측 모델 개발의 기반을 마련합니다.
The growing availability of Earth Observation (EO) data and recent advances in Computer Vision have driven rapid progress in machine learning for EO, producing domain-specific models at ever-increasing scales. Yet this progress risks overlooking fundamental properties of EO data that distinguish it from other domains. We argue that EO data exhibit a multidimensional redundancy (spectral, temporal, spatial, and semantic) which has a more pronounced impact on the domain and its applications than what current literature reflects. To validate this hypothesis, we conduct a systematic domain-specific investigation examining the existence, consistency, and practical implications of this phenomenon across key dimensions of EO variability. Our findings confirm that redundancy in EO data is both substantial and pervasive: exploiting it yields comparable performance ($\approx98.5\%$ of baseline) at a fraction of the computational cost ($\approx4\times$ fewer GFLOPs), at both training and inference. Crucially, these gains are consistent across tasks, geospatial locations, sensors, ground sampling distances, and architectural designs; suggesting that multi-faceted redundancy is a structural property of EO data rather than an artifact of specific experimental choices. These results lay the groundwork for more efficient, scalable, and accessible large-scale EO models.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.