2601.19914v1 Jan 06, 2026 cs.CL

상태 없는 실행 환경에서 복잡한 다중 턴 도구 호출 상호 작용 시뮬레이션

Simulating Complex Multi-Turn Tool Calling Interactions in Stateless Execution Environments

M. Crouse
M. Crouse
Citations: 508
h-index: 12
Ibrahim Abdelaziz
Ibrahim Abdelaziz
Citations: 322
h-index: 8
Kshitij P. Fadnis
Kshitij P. Fadnis
IBM Research
Citations: 287
h-index: 9
Siva Sankalp Patel
Siva Sankalp Patel
Citations: 190
h-index: 5
Kinjal Basu
Kinjal Basu
Citations: 327
h-index: 8
Chulaka Gunasekara
Chulaka Gunasekara
Citations: 406
h-index: 9
Sadhana Kumaravel
Sadhana Kumaravel
IBM Research AI
Citations: 590
h-index: 11
Asim Munawar
Asim Munawar
Citations: 293
h-index: 7
P. Kapanipathi
P. Kapanipathi
Citations: 500
h-index: 11

합성 데이터는 소규모의 비용 효율적인 언어 모델을 튜닝하여 다중 턴 도구 호출 대화의 복잡성을 처리하는 데 유용한 자원으로 입증되었습니다. 다중 턴 도구 호출 데이터를 생성하는 많은 프레임워크와 시스템이 제안되었지만, 기존 연구에서는 도구 호출 상호 작용이 실행 환경의 상태를 유지하는 환경에서 발생한다고 가정하는 경우가 많습니다. 이러한 환경이 제공되면, 상호 작용의 유효성을 실행 환경의 상태가 미리 정의된 목표와 일치하는지 여부에 따라 판단할 수 있다는 장점이 있습니다. 그러나 이는 많은 실제 도구 사용 환경에서 해당되지 않습니다. 예를 들어, 데이터 보안이 가장 중요한 기업 환경이나 여러 소스로부터 도구 사양이 합성되는 경우에 해당됩니다. 본 연구에서는 이러한 격차를 해소하기 위해, 상태 기반 환경에서 검색을 통해 생성된 대화와 유사한 특성을 갖는 도구 호출 대화를 생성하도록 설계된 데이터 생성 방법인 DiGiT-TC를 소개합니다. 우리의 기술의 핵심은, 사용자 요청에 특정 도구 호출을 암시적으로 표현할 수 있는 새로운 생성 패턴에 있습니다. 우리는 표준 도구 호출 벤치마크에서 우리의 접근 방식을 검증하고, 상태 기반 문제 설정에서도 우리의 접근 방식이 상당한 성능 향상을 가져온다는 것을 입증했습니다.

Original Abstract

Synthetic data has proven itself to be a valuable resource for tuning smaller, cost-effective language models to handle the complexities of multi-turn tool calling conversations. While many frameworks and systems for producing synthetic multi-turn tool calling data have been proposed, prior works have frequently assumed that any tool calling interactions will take place in an execution environment that maintains state. When such an environment is available, this is advantageous as it allows for the validity of an interaction to be determined by whether or not the state of the execution environment matches to some prespecified objective. Unfortunately, this does not hold in many real-world tool use settings, e.g., in enterprise settings where data security is of the utmost importance or in cases where tool specifications are synthesized from multiple sources. In this work, we address this gap by introducing a data generation method, DiGiT-TC, that is designed to produce tool calling conversations that have the characteristics of conversations generated through search in a stateful environment. The key to our technique lies in a novel generation pattern that allows our approach to implicitly represent certain tool calls in the user request. We validate our approach on standard tool calling benchmarks and demonstrate that, even in stateful problem settings, our approach results in strong performance gains.

0 Citations
0 Influential
6 Altmetric
30.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!