AIDev: GitHub 상의 AI 코딩 에이전트 연구
AIDev: Studying AI Coding Agents on GitHub
AI 코딩 에이전트는 기능 개발, 디버깅, 테스트 등 다양한 작업을 수행하며 소프트웨어 엔지니어링 분야를 빠르게 변화시키고 있습니다. 이러한 에이전트들이 실제 프로젝트에서 어떻게 활용되는지에 대한 종합적인 데이터는 아직 부족한 상황입니다. 이러한 격차를 해소하기 위해, 우리는 실제 GitHub 저장소에서 AI 에이전트가 작성한 풀 리퀘스트(Agentic-PRs)에 초점을 맞춘 대규모 데이터셋인 AIDev를 소개합니다. AIDev는 OpenAI Codex, Devin, GitHub Copilot, Cursor, 그리고 Claude Code의 5가지 에이전트가 생성한 932,791개의 Agentic-PR을 포함합니다. 이러한 PR들은 116,211개의 저장소에 걸쳐 있으며, 72,189명의 개발자가 참여했습니다. 또한, AIDev는 100개 이상의 별을 받은 2,807개의 저장소에서 추출한 33,596개의 Agentic-PR로 구성된 큐레이션된 하위 집합을 포함하며, 댓글, 리뷰, 커밋 및 관련 이슈와 같은 추가 정보를 제공합니다. 이 데이터셋은 AI 도입, 개발자 생산성 및 소프트웨어 엔지니어링의 새로운 시대에서의 인간-AI 협력에 대한 미래 연구의 기반을 제공합니다.
AI coding agents are rapidly transforming software engineering by performing tasks such as feature development, debugging, and testing. Despite their growing impact, the research community lacks a comprehensive dataset capturing how these agents are used in real-world projects. To address this gap, we introduce AIDev, a large-scale dataset focused on agent-authored pull requests (Agentic-PRs) in real-world GitHub repositories. AIDev aggregates 932,791 Agentic-PRs produced by five agents: OpenAI Codex, Devin, GitHub Copilot, Cursor, and Claude Code. These PRs span 116,211 repositories and involve 72,189 developers. In addition, AIDev includes a curated subset of 33,596 Agentic-PRs from 2,807 repositories with over 100 stars, providing further information such as comments, reviews, commits, and related issues. This dataset offers a foundation for future research on AI adoption, developer productivity, and human-AI collaboration in the new era of software engineering. > AI Agent, Agentic AI, Coding Agent, Agentic Coding, Agentic Software Engineering, Agentic Engineering
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.