최종 텍스트만이 남았을 때: 다중 에이전트 책임 추적을 위한 암묵적 실행 추적
When Only the Final Text Survives: Implicit Execution Tracing for Multi-Agent Attribution
다중 에이전트 시스템이 잘못된 답변이나 유해한 결과를 생성했을 때, 실행 로그와 에이전트 식별자가 없는 경우 누가 책임을 져야 할까요? 다중 에이전트 언어 시스템은 위임 및 반복적인 개선과 같은 구조화된 상호 작용에 점점 더 의존하고 있지만, 최종 출력은 종종 근본적인 상호 작용 구조와 에이전트 기여를 가립니다. 본 연구에서는 IET(Implicit Execution Tracing)라는 메타데이터에 의존하지 않는 프레임워크를 소개합니다. 이 프레임워크는 생성된 텍스트로부터 토큰 수준의 책임 추적을 가능하게 하며, 상호 작용 구조를 재구성하는 간단한 방법을 제공합니다. 생성 과정에서, 에이전트별 키드 신호가 토큰 분포에 포함되어, 텍스트가 자체 설명적인 실행 추적으로 변환됩니다. 이 실행 추적은 비밀 키를 통해서만 감지할 수 있습니다. 감지 시, 상태 변화를 고려한 점수 매기기 방법을 사용하여 에이전트 간의 전환 지점을 식별하고 상호 작용 그래프를 재구성합니다. 실험 결과, IET는 에이전트 분할 및 조정 구조를 높은 정확도로 복원하면서도 생성 품질을 유지하며, 다중 에이전트 언어 시스템에 대한 개인 정보 보호 감사 기능을 제공할 수 있음을 보여줍니다.
When a multi-agent system produces an incorrect or harmful answer, who is accountable if execution logs and agent identifiers are unavailable? Multi-agent language systems increasingly rely on structured interactions such as delegation and iterative refinement, yet the final output often obscures the underlying interaction topology and agent contributions. We introduce IET (Implicit Execution Tracing), a metadata-independent framework that enables token-level attribution directly from generated text and a simple mechanism for interaction topology reconstruction. During generation, agent-specific keyed signals are embedded into the token distribution, transforming the text into a self-describing execution trace detectable only with a secret key. At detection time, a transition-aware scoring method identifies agent handover points and reconstructs the interaction graph. Experiments show that IET recovers agent segments and coordination structure with high accuracy while preserving generation quality, enabling privacy-preserving auditing for multi-agent language systems.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.