2603.17863v1 Mar 18, 2026 cs.LG

머신러닝 분야의 알고리즘 발견 작업을 위한 절차적 생성 방법

Procedural Generation of Algorithm Discovery Tasks in Machine Learning

Zhuoran Li
Zhuoran Li
Citations: 0
h-index: 0
R. Raileanu
R. Raileanu
Citations: 20,856
h-index: 28
Deepak Nathani
Deepak Nathani
University of California, Santa Barbara
Citations: 1,193
h-index: 8
Edan Toledo
Edan Toledo
Citations: 38
h-index: 3
C. Wibault
C. Wibault
Citations: 1
h-index: 1
A. Goldie
A. Goldie
Citations: 34
h-index: 4
A. Hayler
A. Hayler
Citations: 70
h-index: 4
Ken Thampiratwong
Ken Thampiratwong
Citations: 0
h-index: 0
Aleksandra Kalisz
Aleksandra Kalisz
Citations: 53
h-index: 2
Michael Beukman
Michael Beukman
Citations: 155
h-index: 6
Alistair Letcher
Alistair Letcher
Citations: 478
h-index: 7
Theo Wolf
Theo Wolf
Citations: 4
h-index: 1
Charles O'Neill
Charles O'Neill
Citations: 6
h-index: 2
Uljad Berdica
Uljad Berdica
Citations: 20
h-index: 3
Nicholas Roberts
Nicholas Roberts
Citations: 62
h-index: 2
Saeed Rahmani
Saeed Rahmani
Citations: 12
h-index: 3
H. Erlebach
H. Erlebach
Citations: 43
h-index: 1
Shimon Whiteson
Shimon Whiteson
Citations: 24,153
h-index: 67
Jakob Foerster
Jakob Foerster
Citations: 324
h-index: 7

머신러닝 알고리즘 개발을 자동화하는 것은 획기적인 발전을 가져올 잠재력이 있습니다. 그러나 현재까지 개발된 알고리즘 발견 시스템을 개선하고 평가하는 능력은 기존의 작업 모음(task suite)에 의해 제한되어 왔습니다. 이러한 작업 모음은 다음과 같은 문제점을 가지고 있습니다. 즉, 부적절한 평가 방법론, 데이터 오염, 그리고 해결하기 어렵거나 매우 유사한 문제들을 포함하는 경우 등이 있습니다. 본 논문에서는 머신러닝 분야의 알고리즘 발견 작업을 위한 절차적 생성기인 DiscoGen을 소개합니다. DiscoGen은 강화 학습을 위한 최적화 알고리즘 또는 이미지 분류를 위한 손실 함수 개발과 같은 작업을 생성합니다. 강화 학습 분야에서 절차적 생성의 성공을 바탕으로, DiscoGen은 다양한 난이도와 복잡성을 가진 수백만 개의 작업을 생성하며, 이는 다양한 머신러닝 분야에 걸쳐 있습니다. 이러한 작업들은 소수의 구성 매개변수로 정의되며, 알고리즘 발견 에이전트(ADA)를 최적화하는 데 사용될 수 있습니다. 우리는 DiscoGen에서 파생된 고정된 작은 부분집합으로 구성된 벤치마크인 DiscoBench를 제시하여 ADA의 체계적인 평가를 가능하게 합니다. 또한, DiscoGen을 통해 가능하게 되는 야심차고 중요한 연구 방향을 제시하고, DiscoGen을 사용하여 ADA의 프롬프트 최적화를 수행한 실험 결과를 보여줍니다. DiscoGen은 오픈 소스로 https://github.com/AlexGoldie/discogen 에서 제공됩니다.

Original Abstract

Automating the development of machine learning algorithms has the potential to unlock new breakthroughs. However, our ability to improve and evaluate algorithm discovery systems has thus far been limited by existing task suites. They suffer from many issues, such as: poor evaluation methodologies; data contamination; and containing saturated or very similar problems. Here, we introduce DiscoGen, a procedural generator of algorithm discovery tasks for machine learning, such as developing optimisers for reinforcement learning or loss functions for image classification. Motivated by the success of procedural generation in reinforcement learning, DiscoGen spans millions of tasks of varying difficulty and complexity from a range of machine learning fields. These tasks are specified by a small number of configuration parameters and can be used to optimise algorithm discovery agents (ADAs). We present DiscoBench, a benchmark consisting of a fixed, small subset of DiscoGen tasks for principled evaluation of ADAs. Finally, we propose a number of ambitious, impactful research directions enabled by DiscoGen, in addition to experiments demonstrating its use for prompt optimisation of an ADA. DiscoGen is released open-source at https://github.com/AlexGoldie/discogen.

0 Citations
0 Influential
66.094379124341 Altmetric
330.5 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!