2603.02263v1 Feb 28, 2026 cs.CV

Social-JEPA: 자연 발생하는 기하학적 동형 이성질체

Social-JEPA: Emergent Geometric Isomorphism

Rong Fu
Rong Fu
Citations: 0
h-index: 0
Shuai Cao
Shuai Cao
Citations: 387
h-index: 3
Youjin Wang
Youjin Wang
Citations: 8
h-index: 1
Sicheng Fan
Sicheng Fan
Citations: 176
h-index: 7
Haoran Zhang
Haoran Zhang
Citations: 9
h-index: 2
Yifu Duan
Yifu Duan
Citations: 2
h-index: 1
Di Zhao
Di Zhao
Citations: 29
h-index: 3
Wentao Guo
Wentao Guo
Citations: 52
h-index: 4
Xiao Zhou
Xiao Zhou
Citations: 2
h-index: 1

세계 모델은 풍부한 감각 정보를 압축하여 미래 관찰을 예측하는 간결한 잠재 변수 코드로 변환합니다. 본 연구에서는 별도의 에이전트들이 동일한 환경에 대한 서로 다른 관점에서 이러한 모델을 학습하도록 합니다. 이때 파라미터 공유나 조정 없이, 학습된 내부 표현은 놀라운 자연 발생적 특성을 보입니다. 즉, 두 개의 잠재 공간은 대략적인 선형 동형 이성질체 관계를 가지며, 이를 통해 투명한 변환이 가능합니다. 이러한 기하학적 합의는 큰 시점 변화와 제한적인 픽셀 중복에도 견고하게 유지됩니다. 학습된 정렬을 활용하여, 하나의 에이전트에서 학습된 분류기를 추가적인 기울기 업데이트 없이 다른 에이전트로 이전할 수 있으며, 증류와 유사한 방식으로 이전하면 후속 학습 속도를 가속화하고 전체 계산량을 크게 줄일 수 있습니다. 본 연구 결과는 예측 학습 목표가 표현 기하학에 강력한 규칙성을 부여한다는 것을 보여주며, 이는 분산된 시각 시스템 간의 상호 운용성을 위한 가벼운 경로를 제시합니다. 관련 코드는 다음 링크에서 확인할 수 있습니다: https://anonymous.4open.science/r/Social-JEPA-5C57.

Original Abstract

World models compress rich sensory streams into compact latent codes that anticipate future observations. We let separate agents acquire such models from distinct viewpoints of the same environment without any parameter sharing or coordination. After training, their internal representations exhibit a striking emergent property: the two latent spaces are related by an approximate linear isometry, enabling transparent translation between them. This geometric consensus survives large viewpoint shifts and scant overlap in raw pixels. Leveraging the learned alignment, a classifier trained on one agent can be ported to the other with no additional gradient steps, while distillation-like migration accelerates later learning and markedly reduces total compute. The findings reveal that predictive learning objectives impose strong regularities on representation geometry, suggesting a lightweight path to interoperability among decentralized vision systems. The code is available at https://anonymous.4open.science/r/Social-JEPA-5C57.

0 Citations
0 Influential
3.5 Altmetric
17.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!