인지 과학 분야에서 우리는 과학적 발견을 자동화할 수 있는가?
Can we automatize scientific discovery in the cognitive sciences?
인지 과학은 기본 연산을 계산 모델로 형식화하여 지능을 이해하는 것을 목표로 합니다. 전통적으로, 연구자들은 패러다임을 개발하고, 데이터를 수집하며, 미리 정의된 모델 클래스를 테스트하는 발견 과정을 따릅니다. 그러나 이 수동적인 프로세스는 인간의 개입 속도가 느리고, 연구자의 배경 지식 및 직관에 의해 제한되는 검색 공간 때문에 근본적으로 제약을 받습니다. 본 논문에서는 대규모 언어 모델(LLM)을 사용하여 발견 과정의 모든 단계를 구현하는 완전 자동화된, 인공 지능 기반의 마음 과학 패러다임으로의 전환을 제안합니다. 이 프레임워크에서, LLM으로부터 개념적으로 의미 있는 작업 구조를 직접 추출하여 실험 패러다임을 생성합니다. 이후, 인지 모델의 기반 모델을 사용하여 고품질의 행동 데이터를 시뮬레이션합니다. 기존의 번거로운 인지 모델 수작업 과정은 LLM 기반의 프로그램 생성으로 대체되며, 이를 통해 방대한 알고리즘 가설 공간에 대한 고속 검색이 가능합니다. 마지막으로, LLM 평가기를 사용하여 '흥미성'을 최적화함으로써 발견 루프를 완성합니다. 이 자동화된 루프는 이론 개발을 위한 빠르고 확장 가능한 접근 방식을 제공하며, 실제 인간 집단에서 검증될 수 있는 유용한 실험과 메커니즘을 발굴하는 고속의 인공 지능 기반 발견 엔진 역할을 수행합니다.
The cognitive sciences aim to understand intelligence by formalizing underlying operations as computational models. Traditionally, this follows a cycle of discovery where researchers develop paradigms, collect data, and test predefined model classes. However, this manual pipeline is fundamentally constrained by the slow pace of human intervention and a search space limited by researchers' background and intuition. Here, we propose a paradigm shift toward a fully automated, in silico science of the mind that implements every stage of the discovery cycle using Large Language Models (LLMs). In this framework, experimental paradigms exploring conceptually meaningful task structures are directly sampled from an LLM. High-fidelity behavioral data are then simulated using foundation models of cognition. The tedious step of handcrafting cognitive models is replaced by LLM-based program synthesis, which performs a high-throughput search over a vast landscape of algorithmic hypotheses. Finally, the discovery loop is closed by optimizing for ''interestingness'', a metric of conceptual yield evaluated by an LLM-critic. By enabling a fast and scalable approach to theory development, this automated loop functions as a high-throughput in-silico discovery engine, surfacing informative experiments and mechanisms for subsequent validation in real human populations.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.