COEVO: LLM 기반 RTL 코드 생성 시 기능적 정확성과 PPA 최적화를 위한 공동 진화 프레임워크
COEVO: Co-Evolutionary Framework for Joint Functional Correctness and PPA Optimization in LLM-Based RTL Generation
LLM 기반 RTL 코드 생성 방법은 기능적 정확성과 PPA(전력, 성능, 면적) 품질을 동시에 목표로 하지만, 기존 방법들은 이 두 가지 목표를 분리하여, 기능적 정확성이 완전히 달성된 후에만 PPA를 최적화합니다. 순차적인 다중 에이전트 파이프라인, 이진 정확도 게이트를 사용한 진화 탐색, 또는 계층적인 보상 의존성 등 어떤 방법을 사용하든, 부분적으로만 정확하지만 아키텍처적으로 유망한 후보들은 체계적으로 버려집니다. 또한, 기존 방법들은 다중 목적 PPA 공간을 단일 스칼라 피트니스로 축소하여, 면적, 지연 시간, 전력 간의 균형을 파악하기 어렵게 만듭니다. 이러한 한계점을 해결하기 위해, 우리는 정확성과 PPA 최적화를 단일 진화 루프 내에서 통합하는 공동 진화 프레임워크인 COEVO를 제안합니다. COEVO는 면적, 지연 시간, 전력과 함께 정확성을 연속적인 공동 최적화 차원으로 정의하며, 이를 위해 정밀한 점수와 상세한 진단 피드백을 제공하는 향상된 테스트벤치를 사용합니다. 어닐링 기능을 갖춘 적응형 정확도 게이트는 PPA 측면에서 유망하지만 부분적으로만 정확한 후보들이 전체 탐색 과정을 이끌어 공동 최적의 솔루션을 찾도록 합니다. 또한, COEVO는 수동적인 가중치 조정 없이, 네 차원 파레토 기반의 비지배 정렬을 사용하여 PPA의 전체적인 균형 구조를 유지합니다. VerilogEval 2.0 및 RTLLM 2.0 데이터셋에 대한 평가 결과, COEVO는 GPT-5.4-mini를 사용하여 97.5% 및 94.5%의 Pass@1 성능을 달성했으며, 이는 네 가지 LLM 백본에서 모든 에이전트 기반 모델을 능가하는 결과입니다. 또한, 49개의 합성 가능한 RTLLM 설계 중 43개에서 가장 우수한 PPA 성능을 달성했습니다.
LLM-based RTL code generation methods increasingly target both functional correctness and PPA quality, yet existing approaches universally decouple the two objectives, optimizing PPA only after correctness is fully achieved. Whether through sequential multi-agent pipelines, evolutionary search with binary correctness gates, or hierarchical reward dependencies, partially correct but architecturally promising candidates are systematically discarded. Moreover, existing methods reduce the multi-objective PPA space to a single scalar fitness, obscuring the trade-offs among area, delay, and power. To address these limitations, we propose COEVO, a co-evolutionary framework that unifies correctness and PPA optimization within a single evolutionary loop. COEVO formulates correctness as a continuous co-optimization dimension alongside area, delay, and power, enabled by an enhanced testbench that provides fine-grained scoring and detailed diagnostic feedback. An adaptive correctness gate with annealing allows PPA-promising but partially correct candidates to guide the search toward jointly optimal solutions. To preserve the full PPA trade-off structure, COEVO employs four-dimensional Pareto-based non-dominated sorting with configurable intra-level sorting, replacing scalar fitness without manual weight tuning. Evaluated on VerilogEval 2.0 and RTLLM 2.0, COEVO achieves 97.5\% and 94.5\% Pass@1 with GPT-5.4-mini, surpassing all agentic baselines across four LLM backbones, while attaining the best PPA on 43 out of 49 synthesizable RTLLM designs.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.