LLM 기반 화물 협상에서 동적 가격 책정을 위한 앵커-앤-리즘 양보 전략
Anchor-and-Resume Concession Under Dynamic Pricing for LLM-Augmented Freight Negotiation
화물 중개업체는 매일 수천 건의 운송 업체 요율을 동적 가격 조건 하에서 협상하며, 이때 모델은 대화 중에 자주 목표를 수정합니다. 기존의 시간 의존적 양보 프레임워크는 고정된 모양 매개변수 β를 사용하며, 이러한 업데이트에 적응할 수 없습니다. 실시간 스프레드에서 β를 도출하여 적응성을 높일 수 있지만, 이는 새로운 문제를 야기합니다. 가격 변동으로 인해 공식이 이전 제안을 철회하여 단조성을 위반할 수 있습니다. LLM 기반 중개업체는 유연성을 제공하지만, 비용이 많이 드는 추론 모델이 필요하며, 결정론적이지 않은 가격 책정을 수행하고, 프롬프트 주입 공격에 취약할 수 있습니다. 저희는 이러한 한계를 해결하는 두 개의 인덱스를 사용하는 앵커-앤-리즘 프레임워크를 제안합니다. 스프레드에서 파생된 β는 각 화물의 마진 구조를 올바른 양보 전략에 매핑하며, 앵커-앤-리즘 메커니즘은 임의의 가격 변동 하에서 제안이 단조적으로 증가하도록 보장합니다. 모든 가격 결정은 결정론적 공식 내에서 이루어지며, LLM은 사용될 경우 자연어 번역 레이어 역할을 수행합니다. 115,125건의 협상에 대한 실증적 평가 결과, 적응형 β는 상황에 따라 행동을 조정합니다. 좁은 스프레드에서는 거래 성사 및 화물 확보를 우선시하기 위해 빠르게 양보하며, 중간 및 넓은 스프레드에서는 중개업체의 비용 절감 측면에서 기존의 고정된 β 기준을 능가하거나 동등한 수준을 보입니다. 제약 없는 200억 개의 매개변수를 가진 LLM 기반 중개업체와의 비교에서는 유사한 합의율과 비용 절감 효과를 달성했습니다. 보다 현실적인 확률적 상대인 LLM 기반 운송 업체와의 비교에서는 규칙 기반 상대보다 유사한 수준의 비용 절감 효과와 더 높은 합의율을 유지했습니다. LLM을 가격 결정 로직과 분리함으로써, 본 프레임워크는 미미한 추론 비용으로 수천 건의 동시 협상을 처리할 수 있으며, 의사 결정 과정을 투명하게 유지합니다.
Freight brokerages negotiate thousands of carrier rates daily under dynamic pricing conditions where models frequently revise targets mid-conversation. Classical time-dependent concession frameworks use a fixed shape parameter $β$ that cannot adapt to these updates. Deriving $β$ from the live spread enables adaptation but introduces a new problem: a pricing shift can cause the formula to retract a previous offer, violating monotonicity. LLM-powered brokers offer flexibility but require expensive reasoning models, produce non-deterministic pricing, and remain vulnerable to prompt injection. We propose a two-index anchor-and-resume framework that addresses both limitations. A spread-derived $β$ maps each load's margin structure to the correct concession posture, while the anchor-and-resume mechanism guarantees monotonically non-decreasing offers under arbitrary pricing shifts. All pricing decisions remain in a deterministic formula; the LLM, when used, serves only as a natural-language translation layer. Empirical evaluation across 115,125 negotiations shows that the adaptive $β$ tailors behavior by regime: in narrow spreads, it concedes quickly to prioritize deal closure and load coverage; in medium and wide spreads, it matches or exceeds the best fixed-$β$ baselines in broker savings. Against an unconstrained 20-billion-parameter LLM broker, it achieves similar agreement rates and savings. Against LLM-powered carriers as more realistic stochastic counterparties, it maintains comparable savings and higher agreement rates than against rule-based opponents. By decoupling the LLM from pricing logic, the framework scales horizontally to thousands of concurrent negotiations with negligible inference cost and transparent decision-making.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.