2601.16489v1 Jan 23, 2026 cs.SE

EvoConfig: 효율적인 자율 환경 구성 시스템을 위한 자기 진화형 다중 에이전트 시스템

EvoConfig: Self-Evolving Multi-Agent Systems for Efficient Autonomous Environment Configuration

Xin Guo
Xin Guo
Citations: 164
h-index: 4
Jiayi Kuang
Jiayi Kuang
Citations: 181
h-index: 5
Yinghui Li
Yinghui Li
Citations: 53
h-index: 4
Y. Li
Y. Li
Citations: 20,943
h-index: 68
Di Yin
Di Yin
Citations: 1
h-index: 1
Xing Sun
Xing Sun
Citations: 1
h-index: 1
Ying Shen
Ying Shen
Citations: 81
h-index: 5
Hai-Tao Zheng
Hai-Tao Zheng
Citations: 327
h-index: 10
Li Pan
Li Pan
Citations: 64
h-index: 1

안정적이고 실행 가능한 환경은 대규모 언어 모델이 소프트웨어 엔지니어링 작업을 해결하는 데 필수적인 기반입니다. 그러나 복잡하고 번거로운 구성 과정으로 인해 대규모 환경 구성은 상대적으로 비효율적입니다. 또한, 대부분의 방법은 에이전트의 동작에 대한 세밀한 분석을 간과하여 복잡한 오류를 처리하기 어렵고, 결과적으로 구성 실패를 초래합니다. 이러한 문제점을 해결하기 위해, 우리는 올바른 런타임 환경을 구축하기 위해 다중 에이전트 협업을 최적화하는 효율적인 환경 구성 프레임워크인 EvoConfig를 제안합니다. EvoConfig는 실행 후 세밀한 분석을 위한 전문가 진단 모듈과, 전문가 에이전트가 자체적으로 피드백하고 실시간으로 오류 수정 우선순위를 동적으로 조정할 수 있는 자기 진화 메커니즘을 특징으로 합니다. 실험적으로, EvoConfig는 Repo2Run의 420개 저장소에서 기존 최고 성능인 Repo2Run와 동등한 성능을 보였으며, 더 어려운 경우에서 뚜렷한 성능 향상을 보입니다. 특히, 더 어려운 Envbench 데이터셋에서 EvoConfig는 78.1%의 성공률을 달성하여 Repo2Run보다 7.1% 더 높은 성능을 보였습니다. EvoConfig는 최종 성공률뿐만 아니라, 오류 식별 정확도가 높고 기존 방법보다 효과적인 오류 수정 제안을 제공하는 등, 강력한 디버깅 능력을 보여줍니다.

Original Abstract

A reliable executable environment is the foundation for ensuring that large language models solve software engineering tasks. Due to the complex and tedious construction process, large-scale configuration is relatively inefficient. However, most methods always overlook fine-grained analysis of the actions performed by the agent, making it difficult to handle complex errors and resulting in configuration failures. To address this bottleneck, we propose EvoConfig, an efficient environment configuration framework that optimizes multi-agent collaboration to build correct runtime environments. EvoConfig features an expert diagnosis module for fine-grained post-execution analysis, and a self-evolving mechanism that lets expert agents self-feedback and dynamically adjust error-fixing priorities in real time. Empirically, EvoConfig matches the previous state-of-the-art Repo2Run on Repo2Run's 420 repositories, while delivering clear gains on harder cases: on the more challenging Envbench, EvoConfig achieves a 78.1% success rate, outperforming Repo2Run by 7.1%. Beyond end-to-end success, EvoConfig also demonstrates stronger debugging competence, achieving higher accuracy in error identification and producing more effective repair recommendations than existing methods.

1 Citations
0 Influential
30 Altmetric
151.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!