RTL 코드 최적화의 적절한 평가를 위한 새로운 벤치마크
A New Benchmark for the Appropriate Evaluation of RTL Code Optimization
인공지능의 급격한 발전은 효율적인 집적 회로(IC) 설계에 점점 더 의존하고 있습니다. 최근 연구들은 레지스터 전송 레벨(RTL) 코드 생성을 위해 대규모 언어 모델(LLM)을 활용하는 방법을 탐구해 왔으나, 기존 벤치마크들은 전력, 성능, 면적(PPA) 측면에서의 최적화 품질보다는 주로 문법적 정확성을 평가하는 데 그치고 있습니다. 본 연구는 RTL 최적화에 있어서 LLM의 역량을 평가하기 위한 벤치마크인 RTL-OPT를 소개합니다. RTL-OPT는 조합 논리, 파이프라인 데이터 패스, 유한 상태 머신, 메모리 인터페이스 등 다양한 구현 범주를 아우르는 36개의 정교하게 제작된 디지털 설계를 포함하고 있습니다. 각 태스크는 기존 합성 도구로는 포착되지 않는 산업계에서 검증된 최적화 패턴을 반영하여 사람이 최적화한 레퍼런스와 최적화되지 않은 버전, 이렇게 한 쌍의 RTL 코드를 제공합니다. 더 나아가, RTL-OPT는 기능적 정확성을 검증하고 PPA 개선을 정량화하는 자동화된 평가 프레임워크를 통합하여, 하드웨어 설계 최적화를 위한 생성형 모델의 표준화되고 유의미한 평가를 가능하게 합니다.
The rapid progress of artificial intelligence increasingly relies on efficient integrated circuit (IC) design. Recent studies have explored the use of large language models (LLMs) for generating Register Transfer Level (RTL) code, but existing benchmarks mainly evaluate syntactic correctness rather than optimization quality in terms of power, performance, and area (PPA). This work introduces RTL-OPT, a benchmark for assessing the capability of LLMs in RTL optimization. RTL-OPT contains 36 handcrafted digital designs that cover diverse implementation categories including combinational logic, pipelined datapaths, finite state machines, and memory interfaces. Each task provides a pair of RTL codes, a suboptimal version and a human-optimized reference that reflects industry-proven optimization patterns not captured by conventional synthesis tools. Furthermore, RTL-OPT integrates an automated evaluation framework to verify functional correctness and quantify PPA improvements, enabling standardized and meaningful assessment of generative models for hardware design optimization.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.