효율적인 코드 로컬라이제이션을 위한 적응형 병렬 실행 학습
Learning Adaptive Parallel Execution for Efficient Code Localization
코드 로컬라이제이션은 자동화된 소프트웨어 개발 파이프라인의 핵심 병목 구간입니다. 동시 도구 실행은 탐색 속도를 높일 수 있지만, 현재 에이전트들은 34.9%의 중복 호출 비율을 보여 병렬 처리의 이점을 상쇄합니다. 이에 우리는 병렬 코드 로컬라이제이션을 품질-효율성 결합 최적화 작업으로 재정의한 FuseSearch를 제안합니다. 호출 횟수 대비 고유 정보 획득량의 비율인 도구 효율성을 정의하고, 2단계 SFT 및 RL 훈련 방식을 사용하여 적응형 병렬 전략을 학습합니다. 고정 너비 방식과 달리 FuseSearch는 작업 맥락에 따라 탐색 너비를 동적으로 조절하며 탐색 단계에서 정제 단계로 발전합니다. SWE-bench Verified에서의 평가 결과, FuseSearch-4B는 67.7% 더 적은 턴과 68.9% 더 적은 토큰을 사용하면서도 93.6%의 속도 향상을 기록하며 SOTA 수준의 성능(파일 수준 84.7%, 함수 수준 56.4% F1 점수)을 달성했습니다. 이러한 결과는 효율성 인식 훈련이 노이즈가 되는 중복 신호를 제거하여 자연스럽게 품질을 향상시키고, 고성능의 비용 효율적인 로컬라이제이션 에이전트를 구현할 수 있음을 보여줍니다.
Code localization constitutes a key bottleneck in automated software development pipelines. While concurrent tool execution can enhance discovery speed, current agents demonstrate a 34.9\% redundant invocation rate, which negates parallelism benefits. We propose \textbf{FuseSearch}, reformulating parallel code localization as a \textbf{joint quality-efficiency optimization} task. Through defining \textbf{tool efficiency} -- the ratio of unique information gain to invocation count -- we utilize a two-phase SFT and RL training approach for learning adaptive parallel strategies. Different from fixed-breadth approaches, FuseSearch dynamically modulates search breadth according to task context, evolving from exploration phases to refinement stages. Evaluated on SWE-bench Verified, FuseSearch-4B achieves SOTA-level performance (84.7\% file-level and 56.4\% function-level $F_1$ scores) with 93.6\% speedup, utilizing 67.7\% fewer turns and 68.9\% fewer tokens. Results indicate that efficiency-aware training naturally improves quality through eliminating noisy redundant signals, enabling high-performance cost-effective localization agents.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.