2601.18282v2 Jan 26, 2026 cs.AI

사고 증강 함수 호출: 내재된 추론을 통한 LLM 매개변수 정확도 향상

Think-Augmented Function Calling: Improving LLM Parameter Accuracy Through Embedded Reasoning

Lei Wei
Lei Wei
Citations: 2
h-index: 1
Xiao Peng
Xiao Peng
Citations: 3
h-index: 1
Bin Wang
Bin Wang
Citations: 20
h-index: 2
Jinpeng Ou
Jinpeng Ou
Citations: 1
h-index: 1

대규모 언어 모델(LLM)은 자율 에이전트의 함수 호출에서 놀라운 성능을 보여주었지만, 현재의 메커니즘은 특히 상호 의존적인 매개변수를 가진 복잡한 함수의 경우, 매개변수 생성 과정에서 명시적인 추론 투명성이 부족합니다. 기존의 체인 오브 소트(chain-of-thought) 프롬프트와 같은 접근 방식은 에이전트 수준에서 작동하지만, 개별 함수 매개변수에 대한 세분화된 추론 지침을 제공하지 못합니다. 이러한 제한 사항을 해결하기 위해, 함수와 매개변수 수준 모두에서 명시적인 추론을 통해 함수 호출 정확도를 향상시키는 새로운 프레임워크인 사고 증강 함수 호출(TAFC)을 제안합니다. 우리의 방법은 모델이 의사 결정 과정을 설명할 수 있도록 하는 보편적인 "생각(think)" 매개변수 증강을 도입하며, 추론 품질을 향상시키기 위해 매개변수 설명을 동적으로 최적화합니다. 복잡한 매개변수의 경우, TAFC는 복잡도 점수를 기반으로 세분화된 추론을 자동으로 활성화하여 중요한 결정에 대한 적절한 근거를 제공합니다. 또한, 생성된 추론이 인간의 기대와 일치하도록 추론 기반 최적화를 제안합니다. TAFC는 기존 LLM의 아키텍처 변경 없이 기존 API 호환성을 유지합니다. 독점 및 오픈 소스 모델 모두에서 ToolBench를 사용하여 평가한 결과, 다중 매개변수 함수에 대한 매개변수 생성 정확도 및 추론 일관성이 크게 향상되었으며, AI 에이전트의 동작을 디버깅하기 위한 향상된 해석 가능성을 제공합니다.

Original Abstract

Large language models (LLMs) have demonstrated remarkable capabilities in function calling for autonomous agents, yet current mechanisms lack explicit reasoning transparency during parameter generation, particularly for complex functions with interdependent parameters. While existing approaches like chain-of-thought prompting operate at the agent level, they fail to provide fine-grained reasoning guidance for individual function parameters. To address these limitations, we propose Think-Augmented Function Calling (TAFC), a novel framework that enhances function calling accuracy through explicit reasoning at both function and parameter levels. Our method introduces a universal "think" parameter augmentation that enables models to articulate their decision-making process, with dynamic optimization for parameter descriptions to improve reasoning quality. For complex parameters, TAFC automatically triggers granular reasoning based on complexity scoring, ensuring appropriate justification for critical decisions. Additionally, we propose reasoning-guided optimization to align generated reasoning with human expectations. TAFC requires no architectural modifications to existing LLMs while maintaining full API compatibility. Evaluation on ToolBench across proprietary and open-source models demonstrates significant improvements in parameter generation accuracy and reasoning coherence for multi-parameter functions, while providing enhanced interpretability for debugging AI agent behaviors.

1 Citations
0 Influential
1 Altmetric
6.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!