2601.03359v1 Jan 06, 2026 cs.AI

LLM 지시 이행 강화: 프롬프트 지시 최적화를 위한 평가 주도형 멀티 에이전트 워크플로우

Enhancing LLM Instruction Following: An Evaluation-Driven Multi-Agentic Workflow for Prompt Instructions Optimization

Alberto Purpura
Alberto Purpura
Citations: 1
h-index: 1
Li Wang
Li Wang
Citations: 8
h-index: 2
Sahil Badyal
Sahil Badyal
Citations: 89
h-index: 4
Eugenio Beaufrand
Eugenio Beaufrand
Citations: 1
h-index: 1
Adam Faulkner
Adam Faulkner
Citations: 1
h-index: 1

대규모 언어 모델(LLM)은 종종 실질적으로 유의미한 내용을 생성하지만 형식적 제약 조건을 준수하지 못하여, 개념적으로는 올바르나 절차적으로 결함이 있는 결과를 초래하곤 한다. 기존의 프롬프트 개선 방식은 LLM이 수행해야 할 주 작업에 대한 설명을 재구성하는 데 초점을 맞추느라, 응답의 수용 기준으로 작용하는 세부적인 제약 조건은 간과하는 경향이 있다. 본 연구는 정량적 점수를 피드백으로 활용하여 주 작업 설명의 최적화와 제약 조건의 최적화를 분리하고, 이를 반복적으로 수정 및 개선하는 새로운 멀티 에이전트 워크플로우를 제안한다. 평가 결과, 이 방법론을 통해 수정된 프롬프트는 Llama 3.1 8B 및 Mixtral-8x 7B와 같은 모델에서 상당히 더 높은 준수 점수를 기록함을 입증하였다.

Original Abstract

Large Language Models (LLMs) often generate substantively relevant content but fail to adhere to formal constraints, leading to outputs that are conceptually correct but procedurally flawed. Traditional prompt refinement approaches focus on rephrasing the description of the primary task an LLM has to perform, neglecting the granular constraints that function as acceptance criteria for its response. We propose a novel multi-agentic workflow that decouples optimization of the primary task description from its constraints, using quantitative scores as feedback to iteratively rewrite and improve them. Our evaluation demonstrates this method produces revised prompts that yield significantly higher compliance scores from models like Llama 3.1 8B and Mixtral-8x 7B.

0 Citations
0 Influential
2 Altmetric
10.0 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!