WirelessAgent++: 무선 네트워크를 위한 자동화된 에이전트 워크플로우 설계 및 벤치마킹
WirelessAgent++: Automated Agentic Workflow Design and Benchmarking for Wireless Networks
대규모 언어 모델(LLM)을 무선 네트워크에 통합하면서, 무선 작업에 대한 자율적인 AI 에이전트 개발에 대한 관심이 높아지고 있습니다. 그러나 기존 접근 방식은 수동으로 작성된 프롬프트와 정적인 에이전트 워크플로우에 크게 의존하는데, 이는 노동 집약적이고 확장성이 부족하며 종종 최적이 아닙니다. 본 논문에서는 다양한 무선 작업에 대한 에이전트 워크플로우 설계를 자동화하는 프레임워크인 WirelessAgent++를 제안합니다. WirelessAgent++는 각 워크플로우를 모듈식 연산자로 구성된 실행 가능한 코드로 취급하고, 에이전트 설계를 프로그램 검색 문제로 간주하여 도메인에 특화된 몬테카를로 트리 탐색(MCTS) 알고리즘을 사용하여 해결합니다. 또한, 지식 추론, 코드 기반 도구 사용 및 다단계 의사 결정을 포괄하는 표준화된 다차원 벤치마크 스위트인 WirelessBench를 구축했습니다. 실험 결과, WirelessAgent++는 자율적으로 우수한 워크플로우를 발견하며, Wireless Communication Homework (WCHW)에서 $78.37%$, Network Slicing (WCNS)에서 $90.95%$, Mobile Service Assurance (WCMSA)에서 $97.07%$의 테스트 점수를 달성했으며, 총 검색 비용은 작업당 5달러 미만입니다. 특히, 제안하는 방법은 최첨단 프롬프트 기반 모델보다 최대 $31%$, 일반적인 워크플로우 최적화 도구보다 $11.1%$ 더 우수한 성능을 보여주며, 견고하고 자체 진화하는 무선 에이전트를 생성하는 데 효과적임을 입증합니다. 코드는 https://github.com/jwentong/WirelessAgent-R2 에서 확인할 수 있습니다.
The integration of large language models (LLMs) into wireless networks has sparked growing interest in building autonomous AI agents for wireless tasks. However, existing approaches rely heavily on manually crafted prompts and static agentic workflows, a process that is labor-intensive, unscalable, and often suboptimal. In this paper, we propose WirelessAgent++, a framework that automates the design of agentic workflows for various wireless tasks. By treating each workflow as an executable code composed of modular operators, WirelessAgent++ casts agent design as a program search problem and solves it with a domain-adapted Monte Carlo Tree Search (MCTS) algorithm. Moreover, we establish WirelessBench, a standardized multi-dimensional benchmark suite comprising Wireless Communication Homework (WCHW), Network Slicing (WCNS), and Mobile Service Assurance (WCMSA), covering knowledge reasoning, code-augmented tool use, and multi-step decision-making. Experiments demonstrate that \wap{} autonomously discovers superior workflows, achieving test scores of $78.37\%$ (WCHW), $90.95\%$ (WCNS), and $97.07\%$ (WCMSA), with a total search cost below $\$ 5$ per task. Notably, our approach outperforms state-of-the-art prompting baselines by up to $31\%$ and general-purpose workflow optimizers by $11.1\%$, validating its effectiveness in generating robust, self-evolving wireless agents. The code is available at https://github.com/jwentong/WirelessAgent-R2.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.