기술에서 재능으로: 실제 기업을 모방한 이질적인 에이전트 조직화
From Skills to Talent: Organising Heterogeneous Agents as a Real-World Company
개별 에이전트의 기능은 모듈식 기술과 도구 통합을 통해 빠르게 발전해 왔지만, 다중 에이전트 시스템은 여전히 고정된 팀 구조, 긴밀하게 결합된 조정 로직, 그리고 세션 기반 학습에 의해 제약됩니다. 우리는 이것이 더 근본적인 결여에서 비롯된다고 주장합니다. 즉, 개별 에이전트가 무엇을 알고 있는지와 분리되어, 에이전트 집단을 어떻게 구성하고, 관리하고, 시간이 지남에 따라 개선할지에 대한 체계적인 조직 계층이 부족하다는 것입니다. 이러한 격차를 메우기 위해, 우리는 다중 에이전트 시스템을 조직 수준으로 끌어올리는 프레임워크인 extit{OneManCompany (OMC)}를 소개합니다. OMC는 기술, 도구 및 런타임 구성을 휴대 가능한 에이전트 ID인 extit{Talents}로 캡슐화하며, 다양한 백엔드를 추상화하는 유형화된 조직 인터페이스를 통해 이를 조정합니다. 커뮤니티 주도의 extit{Talent Market}은 필요에 따라 인력을 확보할 수 있도록 하여, 조직이 기능적 격차를 해소하고 실행 중에 동적으로 재구성할 수 있도록 합니다. 조직적 의사 결정은 extit{Explore-Execute-Review} ($ ext{E}^2$R) 트리 검색을 통해 구현되며, 계획, 실행 및 평가를 단일 계층 구조 루프에서 통합합니다. 이 루프는 종료 및 데드락 방지에 대한 형식적인 보장을 제공하는 동시에 인간 조직의 피드백 메커니즘을 반영합니다. 이러한 기여를 통해 다중 에이전트 시스템은 정적이고 사전 구성된 파이프라인에서 벗어나, 다양한 도메인의 개방형 작업에 적응할 수 있는 자기 조직화 및 자기 개선 AI 조직으로 진화합니다. PRDBench에 대한 실증적 평가는 OMC가 84.67%의 성공률을 달성했으며, 이는 최첨단 기술보다 15.48% 높은 수치임을 보여줍니다. 또한, 다양한 도메인의 사례 연구를 통해 OMC의 일반성을 더욱 입증합니다.
Individual agent capabilities have advanced rapidly through modular skills and tool integrations, yet multi-agent systems remain constrained by fixed team structures, tightly coupled coordination logic, and session-bound learning. We argue that this reflects a deeper absence: a principled organisational layer that governs how a workforce of agents is assembled, governed, and improved over time, decoupled from what individual agents know. To fill this gap, we introduce \emph{OneManCompany (OMC)}, a framework that elevates multi-agent systems to the organisational level. OMC encapsulates skills, tools, and runtime configurations into portable agent identities called \emph{Talents}, orchestrated through typed organisational interfaces that abstract over heterogeneous backends. A community-driven \emph{Talent Market} enables on-demand recruitment, allowing the organisation to close capability gaps and reconfigure itself dynamically during execution. Organisational decision-making is operationalised through an \emph{Explore-Execute-Review} ($\text{E}^2$R) tree search, which unifies planning, execution, and evaluation in a single hierarchical loop: tasks are decomposed top-down into accountable units and execution outcomes are aggregated bottom-up to drive systematic review and refinement. This loop provides formal guarantees on termination and deadlock freedom while mirroring the feedback mechanisms of human enterprises. Together, these contributions transform multi-agent systems from static, pre-configured pipelines into self-organising and self-improving AI organisations capable of adapting to open-ended tasks across diverse domains. Empirical evaluation on PRDBench shows that OMC achieves an $84.67\%$ success rate, surpassing the state of the art by $15.48$ percentage points, with cross-domain case studies further demonstrating its generality.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.