AgenticPay: 구매자-판매자 거래를 위한 멀티 에이전트 LLM 협상 시스템
AgenticPay: A Multi-Agent LLM Negotiation System for Buyer-Seller Transactions
대규모 언어 모델(LLM) 기반 에이전트가 자율적으로 협상, 조정 및 거래를 수행할 것으로 점점 더 기대되고 있지만, 기존 벤치마크는 다중 에이전트 간의 언어 매개 경제적 상호작용을 평가하기 위한 원칙적인 설정이 부족합니다. 본 논문에서는 자연어 기반의 멀티 에이전트 구매자-판매자 협상을 위한 벤치마크이자 시뮬레이션 프레임워크인 AgenticPay를 소개합니다. AgenticPay는 구매자와 판매자가 비공개 제약 조건과 제품별 가치 평가를 가지며, 단순한 수치 입찰이 아닌 다중 라운드 언어 협상을 통해 합의에 도달해야 하는 시장을 모델링합니다. 이 프레임워크는 양자 협상에서 다대다 시장에 이르는 110개 이상의 다양한 작업을 지원하며, 구조화된 행동 추출 기능과 실현 가능성, 효율성 및 후생을 평가하는 지표를 제공합니다. 최신 독점 및 오픈 웨이트 LLM을 벤치마킹한 결과 협상 성능에서 상당한 격차가 확인되었으며, 장기적인 전략적 추론의 어려움이 부각되었습니다. 이를 통해 AgenticPay는 에이전트 상거래 및 언어 기반 시장 상호작용 연구를 위한 기반을 마련합니다. 코드와 데이터셋은 https://github.com/SafeRL-Lab/AgenticPay 에서 이용 가능합니다.
Large language model (LLM)-based agents are increasingly expected to negotiate, coordinate, and transact autonomously, yet existing benchmarks lack principled settings for evaluating language-mediated economic interaction among multiple agents. We introduce AgenticPay, a benchmark and simulation framework for multi-agent buyer-seller negotiation driven by natural language. AgenticPay models markets in which buyers and sellers possess private constraints and product-dependent valuations, and must reach agreements through multi-round linguistic negotiation rather than numeric bidding alone. The framework supports a diverse suite of over 110 tasks ranging from bilateral bargaining to many-to-many markets, with structured action extraction and metrics for feasibility, efficiency, and welfare. Benchmarking state-of-the-art proprietary and open-weight LLMs reveals substantial gaps in negotiation performance and highlights challenges in long-horizon strategic reasoning, establishing AgenticPay as a foundation for studying agentic commerce and language-based market interaction. Code and dataset are available at the link: https://github.com/SafeRL-Lab/AgenticPay.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.