2601.09292v1 Jan 14, 2026 cs.CR

블루 팀 기능 호출 에이전트

Blue Teaming Function-Calling Agents

Greta Dolcetti
Greta Dolcetti
Citations: 64
h-index: 5
Giulio Zizzo
Giulio Zizzo
Citations: 397
h-index: 12
S. Maffeis
S. Maffeis
Citations: 2,317
h-index: 21

본 논문에서는 기능 호출 능력을 갖는 것으로 주장하는 네 가지 오픈 소스 LLM의 견고성을 세 가지 공격에 대한 실험적 평가를 통해 분석하고, 여덟 가지 방어 기법의 효과성을 측정합니다. 연구 결과는 이러한 모델들이 기본적으로 안전하지 않으며, 현재 개발된 방어 기법들은 실제 환경에서 활용하기 어렵다는 것을 보여줍니다.

Original Abstract

We present an experimental evaluation that assesses the robustness of four open source LLMs claiming function-calling capabilities against three different attacks, and we measure the effectiveness of eight different defences. Our results show how these models are not safe by default, and how the defences are not yet employable in real-world scenarios.

0 Citations
0 Influential
10.5 Altmetric
52.5 Score
Original PDF

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

Log in to request an AI analysis.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!