2604.17351v1 Apr 19, 2026 cs.AI

SOCIA-EVO: 이중 고정 진화적 프레임워크를 이용한 자동 시뮬레이터 구축

SOCIA-EVO: Automated Simulator Construction via Dual-Anchored Bi-Level Optimization

Sion Weatherhead
Sion Weatherhead
Citations: 3
h-index: 1
Mehdi Jafari
Mehdi Jafari
Citations: 3
h-index: 1
H. Xue
H. Xue
Citations: 122
h-index: 7
F. Salim
F. Salim
Citations: 499
h-index: 11
Devin Yuncheng Hua
Devin Yuncheng Hua
Citations: 3
h-index: 1

자동 시뮬레이터 구축은 일반적인 코드 생성과 달리 분포적 충실도가 요구됩니다. 우리는 장기적인 LLM 에이전트에서 발생하는 두 가지 문제점을 파악했습니다. 바로 문맥적 편향과 구조적 오류와 매개변수 오류를 혼동하여 발생하는 최적화 불안정성입니다. 우리는 이중 고정 진화적 프레임워크인 SOCIA-EVO를 제안합니다. SOCIA-EVO는 다음과 같은 특징을 갖습니다: (1) 실증적 제약을 강제하는 정적 청사진, (2) 구조적 개선과 매개변수 보정을 분리하는 양층 최적화, (3) 베이즈 가중 검색을 통해 개선 방안을 관리하는 자체 관리 전략 플레이북. SOCIA-EVO는 실행 피드백을 통해 비효율적인 전략을 반증함으로써 견고한 수렴을 달성하며, 관측 데이터와 통계적으로 일관된 시뮬레이터를 생성합니다. SOCIA-EVO의 코드와 데이터는 다음 위치에서 확인할 수 있습니다: https://github.com/cruiseresearchgroup/SOCIA/tree/evo.

Original Abstract

Automated simulator construction requires distributional fidelity, distinguishing it from generic code generation. We identify two failure modes in long-horizon LLM agents: contextual drift and optimization instability arising from conflating structural and parametric errors. We propose SOCIA-EVO, a dual-anchored evolutionary framework. SOCIA-EVO introduces: (1) a static blueprint to enforce empirical constraints; (2) a bi-level optimization to decouple structural refinement from parameter calibration; and (3) a self-curating Strategy Playbook that manages remedial hypotheses via Bayesian-weighted retrieval. By falsifying ineffective strategies through execution feedback, SOCIA-EVO achieves robust convergence, generating simulators that are statistically consistent with observational data. The code and data of SOCIA-EVO are available here: https://github.com/cruiseresearchgroup/SOCIA/tree/evo.

0 Citations
0 Influential
46.135671925225 Altmetric
230.7 Score
Original PDF
61

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!