2601.21372v1 Jan 29, 2026 cs.AI

NEMO: 자율 코딩 에이전트를 통한 실행 인식 최적화 모델링

NEMO: Execution-Aware Optimization Modeling via Autonomous Coding Agents

Sina Pakazad
Sina Pakazad
Citations: 27
h-index: 2
Henrik Ohlsson
Henrik Ohlsson
Citations: 1
h-index: 1
Yang Song
Yang Song
Citations: 2,628
h-index: 7
Anoushka Vyas
Anoushka Vyas
Citations: 25
h-index: 2
Zirui Wei
Zirui Wei
Citations: 2
h-index: 1
Graham Neubig
Graham Neubig
Citations: 11
h-index: 2

본 논문에서는 의사결정 문제에 대한 자연어 설명을 형식적이고 실행 가능한 수학적 최적화 구현으로 변환하는 시스템인 NEMO를 제안한다. 이 시스템은 사용자와 협력하거나 자율적으로 작동한다. 기존 접근 방식은 일반적으로 특화된 대규모 언어 모델(LLM)이나 맞춤형 과제별 에이전트에 의존한다. 이러한 방법들은 종종 불안정하고 복잡하며, 문법적으로 유효하지 않거나 실행 불가능한 코드를 빈번하게 생성한다. 대신 NEMO는 자율 코딩 에이전트(ACA)와의 원격 상호작용에 중점을 두며, 이를 LLM과의 API 기반 상호작용과 유사한 일급 추상화(first-class abstraction)로 취급한다. 이러한 설계는 작업 명세를 구조화하고 통합하며 반복적으로 정제하는 ACA 기반의 상위 수준 시스템 구축을 가능하게 한다. ACA는 샌드박스 환경 내에서 실행되므로, NEMO가 생성한 코드는 설계상 실행 가능성이 보장되며, 자동화된 검증 및 수정이 가능하다. 이를 바탕으로 우리는 독립적으로 생성된 최적화기와 시뮬레이터 구현 간의 비대칭 검증 루프(상위 수준 검증 메커니즘 역할), 경험 재사용을 위한 외부 메모리, 그리고 최소 베이즈 위험(MBR) 디코딩 및 자기 일관성(self-consistency)을 통한 견고성 향상을 포함하여, ACA 내부 및 ACA 간의 새로운 조정 패턴을 소개한다. 우리는 9개의 기존 최적화 벤치마크에서 NEMO를 평가한다. 그림 1에서 볼 수 있듯이, NEMO는 대다수의 과제에서 최고 수준(SOTA)의 성능을 달성했으며, 특히 여러 데이터셋에서는 상당한 격차를 보였다. 이는 자동화된 최적화 모델링을 위한 실행 인식 에이전트 아키텍처의 강력함을 입증한다.

Original Abstract

In this paper, we present NEMO, a system that translates Natural-language descriptions of decision problems into formal Executable Mathematical Optimization implementations, operating collaboratively with users or autonomously. Existing approaches typically rely on specialized large language models (LLMs) or bespoke, task-specific agents. Such methods are often brittle, complex and frequently generating syntactically invalid or non-executable code. NEMO instead centers on remote interaction with autonomous coding agents (ACAs), treated as a first-class abstraction analogous to API-based interaction with LLMs. This design enables the construction of higher-level systems around ACAs that structure, consolidate, and iteratively refine task specifications. Because ACAs execute within sandboxed environments, code produced by NEMO is executable by construction, allowing automated validation and repair. Building on this, we introduce novel coordination patterns with and across ACAs, including asymmetric validation loops between independently generated optimizer and simulator implementations (serving as a high-level validation mechanism), external memory for experience reuse, and robustness enhancements via minimum Bayes risk (MBR) decoding and self-consistency. We evaluate NEMO on nine established optimization benchmarks. As depicted in Figure 1, it achieves state-of-the-art performance on the majority of tasks, with substantial margins on several datasets, demonstrating the power of execution-aware agentic architectures for automated optimization modeling.

0 Citations
0 Influential
3.5 Altmetric
17.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!