2601.03493v1 Jan 07, 2026 cs.CL

자동 프롬프트 최적화에서의 서브모듈러 평가 부분집합 선택

Submodular Evaluation Subset Selection in Automatic Prompt Optimization

Jinming Nian
Jinming Nian
Citations: 23
h-index: 3
D. Park
D. Park
Citations: 599
h-index: 12
Zhiyuan Peng
Zhiyuan Peng
Citations: 97
h-index: 7
Hongwei Shang
Hongwei Shang
Citations: 354
h-index: 9
Yi Fang
Yi Fang
Citations: 21
h-index: 2

자동 프롬프트 최적화는 수동 프롬프트 엔지니어링을 줄여주지만, 주요 피드백 신호로 작고, 종종 무작위로 추출된 평가 부분집합에 의존합니다. 그러나 평가 부분집합 선택은 일반적으로 구현 세부 사항으로 취급되는 경우가 많습니다. 본 연구에서는 프롬프트 최적화를 위한 평가 부분집합 선택을 원칙적인 관점에서 연구하고, 서브모듈러 평가 부분집합 선택 방법인 SESS를 제안합니다. 선택 문제를 목적 함수를 최대화하는 문제로 정의하고, 완화된 조건 하에서 이는 단조적이고 서브모듈러적이라는 것을 보여주며, 이를 통해 이론적 보장이 가능한 탐욕적인 선택 방법을 사용할 수 있습니다. GSM8K, MATH, 그리고 GPQA-Diamond 데이터셋에서 서브모듈러 방식으로 선택된 평가 부분집합은 무작위 또는 휴리스틱 기반의 기준보다 더 나은 최적화된 프롬프트를 얻을 수 있습니다.

Original Abstract

Automatic prompt optimization reduces manual prompt engineering, but relies on task performance measured on a small, often randomly sampled evaluation subset as its main source of feedback signal. Despite this, how to select that evaluation subset is usually treated as an implementation detail. We study evaluation subset selection for prompt optimization from a principled perspective and propose SESS, a submodular evaluation subset selection method. We frame selection as maximizing an objective set function and show that, under mild conditions, it is monotone and submodular, enabling greedy selection with theoretical guarantees. Across GSM8K, MATH, and GPQA-Diamond, submodularly selected evaluation subsets can yield better optimized prompts than random or heuristic baselines.

0 Citations
0 Influential
6 Altmetric
30.0 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!