LLM 능력에 대한 페르소나 기반 제어의 영향에 대한 체계적 분석
A Systematic Analysis of the Impact of Persona Steering on LLM Capabilities
대규모 언어 모델(LLM)에 특정 페르소나를 부여하는 것은 상호 작용 방식을 조정하는 데 널리 사용되지만, 이러한 부여가 근본적인 인지 능력에 미치는 영향은 아직 탐구되지 않았습니다. 본 연구에서는 뉴런 기반 성격 특성 유도(NPTI) 프레임워크를 사용하여 LLM에 빅 파이브 성격 특성을 부여하고, 6가지 인지 벤치마크를 통해 성능을 평가했습니다. 연구 결과, 페르소나 부여는 표면적인 스타일 변화를 넘어 인지 작업 성능에 안정적이고 재현 가능한 변화를 가져온다는 것을 보여줍니다. 이러한 효과는 작업에 따라 강하게 달라지는데, 특정 성격은 지시 사항 준수 능력 향상에 기여하는 반면, 다른 성격은 복잡한 추론 능력을 저하시킵니다. 효과의 크기는 성격 특성 차원에 따라 체계적으로 다르며, 개방성과 외향성이 가장 강력한 영향을 미칩니다. 또한, LLM의 효과는 인간의 성격-인지 관계와 73.68%의 방향성 일관성을 보입니다. 이러한 규칙성을 활용하여, 추가적인 학습 없이도 최상의 정적 페르소나보다 뛰어난 성능을 보이는 경량의 쿼리 적응형 전략인 동적 페르소나 라우팅(DPR)을 제안합니다.
Imbuing Large Language Models (LLMs) with specific personas is prevalent for tailoring interaction styles, yet the impact on underlying cognitive capabilities remains unexplored. We employ the Neuron-based Personality Trait Induction (NPTI) framework to induce Big Five personality traits in LLMs and evaluate performance across six cognitive benchmarks. Our findings reveal that persona induction produces stable, reproducible shifts in cognitive task performance beyond surface-level stylistic changes. These effects exhibit strong task dependence: certain personalities yield consistent gains on instruction-following, while others impair complex reasoning. Effect magnitude varies systematically by trait dimension, with Openness and Extraversion exerting the most robust influence. Furthermore, LLM effects show 73.68% directional consistency with human personality-cognition relationships. Capitalizing on these regularities, we propose Dynamic Persona Routing (DPR), a lightweight query-adaptive strategy that outperforms the best static persona without additional training.
No Analysis Report Yet
This paper hasn't been analyzed by Gemini yet.
Log in to request an AI analysis.