LLM 라우팅을 추론으로: MaxSAT 관점
LLM Routing as Reasoning: A MaxSAT View
사용자 선호도가 자연어로 표현되고 모델 속성이 부분적으로만 관찰될 수 있는 상황에서, 적절한 LLM을 통해 쿼리를 라우팅하는 것은 어려운 과제입니다. 본 연구에서는 자연어 피드백이 모델 속성에 대한 강제 조건 및 약한 조건을 유도하는 가중 MaxSAT/MaxSMT 문제로 표현되는, 언어에 조건화된 LLM 라우팅을 제약 기반으로 해석합니다. 이러한 관점에서 라우팅은 피드백에 조건화된 절의 만족도를 근사적으로 최대화하는 모델을 선택하는 것과 같습니다. 25개의 모델로 구성된 벤치마크에 대한 실증 분석 결과, 언어 피드백은 거의 실행 가능한 추천 집합을 생성하는 반면, 피드백이 없는 시나리오에서는 체계적인 선호도가 드러납니다. 이러한 결과는 LLM 라우팅이 언어에 조건화된 선호도 하에서 구조화된 제약 최적화 문제로 이해될 수 있음을 시사합니다.
Routing a query through an appropriate LLM is challenging, particularly when user preferences are expressed in natural language and model attributes are only partially observable. We propose a constraint-based interpretation of language-conditioned LLM routing, formulating it as a weighted MaxSAT/MaxSMT problem in which natural language feedback induces hard and soft constraints over model attributes. Under this view, routing corresponds to selecting models that approximately maximize satisfaction of feedback-conditioned clauses. Empirical analysis on a 25-model benchmark shows that language feedback produces near-feasible recommendation sets, while no-feedback scenarios reveal systematic priors. Our results suggest that LLM routing can be understood as structured constraint optimization under language-conditioned preferences.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.