추론 LLM을 활용한 전략 기반 최적화 모델링
Strategy-Aware Optimization Modeling with Reasoning LLMs
대규모 언어 모델(LLM)은 문법적으로 유효한 최적화 프로그램을 생성할 수 있지만, 효과적인 모델링 전략을 안정적으로 선택하는 데 어려움을 겪어, 잘못된 모델 구성과 비효율적인 솔버 동작을 초래하는 경우가 많습니다. 본 연구에서는 모델링 전략을 데이터 구성 및 후처리 과정에 명시적으로 반영하는 SAGE라는 전략 기반 프레임워크를 제안합니다. SAGE는 솔버로 검증된 다중 전략 데이터 세트를 구축하고, 형식이 준수되는지, 정확한지, 그리고 솔버 효율성에 대한 복합적인 보상을 사용하여 지도 학습 방식으로 학생 모델을 훈련한 후, Segment-Weighted GRPO를 적용합니다. 합성 데이터와 실제 데이터로 구성된 8개의 벤치마크에서, SAGE는 평균 pass@1 성능을 72.7에서 80.3으로 향상시켰습니다. 여러 번의 생성 과정을 통해, SAGE는 더 다양한 정확한 모델 구성을 발견하고, pass@16에서 구성 요소 수준의 다양성을 19-29% 향상시켰습니다. 대규모 환경에서 SAGE는 기준 모델보다 14.2% 적은 제약 조건을 가진 더 간결한 제약 시스템을 생성하여 솔버 효율적인 모델링을 가능하게 합니다. 전반적으로, 본 연구 결과는 모델링 전략을 명시적으로 반영하는 것이 자동화된 최적화 모델링 성능을 향상시킬 수 있음을 보여줍니다. 코드 및 관련 자료는 다음 링크에서 확인할 수 있습니다: https://github.com/rachhhhing/SAGE.
Large language models (LLMs) can generate syntactically valid optimization programs, yet often struggle to reliably choose an effective modeling strategy, leading to incorrect formulations and inefficient solver behavior. We propose SAGE, a strategy-aware framework that makes Modeling Strategy explicit in both data construction and post-training. SAGE builds a solver-verified multi-strategy dataset and trains a student model with supervised fine-tuning followed by Segment-Weighted GRPO using a composite reward over format compliance, correctness, and solver efficiency. Across eight benchmarks spanning synthetic and real-world settings, SAGE improves average pass@1 from 72.7 to 80.3 over the strongest open-source baseline. With multiple generations, SAGE discovers more distinct correct formulations and improves component-level diversity at pass@16 by 19-29%. At the largest scale, SAGE produces more compact constraint systems with 14.2% fewer constraints than the baseline, consistent with solver-efficient modeling. Overall, these results show that making Modeling Strategy explicit improves automated optimization modeling. Code is available at https://github.com/rachhhhing/SAGE.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.