호출 트리를 활용한 다중 에이전트 부분 그래프 추천 방법 연구
Learning to Recommend Multi-Agent Subgraphs from Calling Trees
다중 에이전트 시스템(MAS)은 점점 더 복잡한 작업을 수행하기 위해 빠르게 성장하는 마켓플레이스에서 선택된 에이전트와 도구를 조율합니다. 이러한 마켓플레이스가 확장됨에 따라, 많은 후보 항목들이 기능적으로 중복되어 선택이 단순한 검색 문제가 아니게 되었습니다. 오케스트레이터는 관련 에이전트를 필터링하는 것 외에도, 현재 실행 환경과 호환되고 다른 선택된 에이전트와 협력할 수 있는 신뢰성 있는 옵션을 선택해야 합니다. 기존의 추천 시스템은 주로 평탄한 사용자-항목 로그를 기반으로 항목 수준의 순위를 매기는 데 사용되므로, 에이전트 조율의 구조적, 순차적, 그리고 상호 작용 의존적인 특성을 직접적으로 다루지 못합니다. 본 연구에서는 다중 에이전트 시스템에서의 에이전트 추천을 제약 조건이 있는 의사 결정 문제로 정의하고, 현재 부분 작업 및 컨텍스트에 따라 후보 집합을 구축하는 검색 단계를 거친 후, 관련성, 신뢰성 및 상호 작용 효과를 고려하는 학습된 평가 함수를 사용하여 이 실현 가능한 집합 내에서 효용성을 최적화하는 일반적인 제약 조건 추천 프레임워크를 제안합니다. 본 연구에서는 제약 조건 정의 및 학습 신호를 에이전트 시스템의 실행 구조(부모-자식 호출, 분기 종속성 및 로컬 협력 패턴)를 포착하는 과거 호출 트리에 기반하여 활용합니다. 제안하는 프레임워크는 다음과 같은 두 가지 상호 보완적인 방식으로 활용될 수 있습니다: 에이전트 수준 추천(다음 에이전트/도구 선택) 및 시스템 수준 추천(조정된 실행을 위한 작고 연결된 에이전트 팀/부분 그래프 선택). 체계적인 평가를 위해, 본 연구에서는 8개의 이기종 다중 에이전트 데이터셋의 호출 로그를 공통된 구조화된 표현으로 정규화하여 통합된 호출 트리 벤치마크를 구축했습니다.
Multi-agent systems (MAS) increasingly solve complex tasks by orchestrating agents and tools selected from rapidly growing marketplaces. As these marketplaces expand, many candidates become functionally overlapping, making selection not just a retrieval problem: beyond filtering relevant agents, an orchestrator must choose options that are reliable, compatible with the current execution context, and able to cooperate with other selected agents. Existing recommender systems -- largely built for item-level ranking from flat user-item logs -- do not directly address the structured, sequential, and interaction-dependent nature of agent orchestration. We address this gap by \textbf{formulating agent recommendation in MAS as a constrained decision problem} and introducing a generic \textbf{constrained recommendation framework} that first uses retrieval to build a compact candidate set conditioned on the current subtask and context, and then performs \textbf{utility optimization} within this feasible set using a learned scorer that accounts for relevance, reliability, and interaction effects. We ground both the formulation and learning signals in \textbf{historical calling trees}, which capture the execution structure of MAS (parent-child calls, branching dependencies, and local cooperation patterns) beyond what flat logs provide. The framework supports two complementary settings: \textbf{agent-level recommendation} (select the next agent/tool) and \textbf{system-level recommendation} (select a small, connected agent team/subgraph for coordinated execution). To enable systematic evaluation, we construct a unified calling-tree benchmark by normalizing invocation logs from eight heterogeneous multi-agent corpora into a shared structured representation.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.