LLM 지시 이행 강화: 프롬프트 지시 최적화를 위한 평가 주도형 멀티 에이전트 워크플로우
Enhancing LLM Instruction Following: An Evaluation-Driven Multi-Agentic Workflow for Prompt Instructions Optimization
대규모 언어 모델(LLM)은 종종 실질적으로 유의미한 내용을 생성하지만 형식적 제약 조건을 준수하지 못하여, 개념적으로는 올바르나 절차적으로 결함이 있는 결과를 초래하곤 한다. 기존의 프롬프트 개선 방식은 LLM이 수행해야 할 주 작업에 대한 설명을 재구성하는 데 초점을 맞추느라, 응답의 수용 기준으로 작용하는 세부적인 제약 조건은 간과하는 경향이 있다. 본 연구는 정량적 점수를 피드백으로 활용하여 주 작업 설명의 최적화와 제약 조건의 최적화를 분리하고, 이를 반복적으로 수정 및 개선하는 새로운 멀티 에이전트 워크플로우를 제안한다. 평가 결과, 이 방법론을 통해 수정된 프롬프트는 Llama 3.1 8B 및 Mixtral-8x 7B와 같은 모델에서 상당히 더 높은 준수 점수를 기록함을 입증하였다.
Large Language Models (LLMs) often generate substantively relevant content but fail to adhere to formal constraints, leading to outputs that are conceptually correct but procedurally flawed. Traditional prompt refinement approaches focus on rephrasing the description of the primary task an LLM has to perform, neglecting the granular constraints that function as acceptance criteria for its response. We propose a novel multi-agentic workflow that decouples optimization of the primary task description from its constraints, using quantitative scores as feedback to iteratively rewrite and improve them. Our evaluation demonstrates this method produces revised prompts that yield significantly higher compliance scores from models like Llama 3.1 8B and Mixtral-8x 7B.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.