2602.01519v1 Feb 02, 2026 cs.LG

네이티브 위치 독립적 캐싱을 위해서는 인코더가 필요합니다

You Need an Encoder for Native Position-Independent Caching

Shiju Zhao
Shiju Zhao
Citations: 11
h-index: 2
Junhao Hu
Junhao Hu
Citations: 6
h-index: 1
Jiaqi Zheng
Jiaqi Zheng
Citations: 959
h-index: 18
Guihai Chen
Guihai Chen
Citations: 34
h-index: 3

대규모 언어 모델(LLM)의 키-값(KV) 캐시는 접두사 기반으로 작동하며, 이는 임의의 순서로 검색된 컨텍스트를 처리하는 데 매우 비효율적입니다. 위치 독립적 캐싱(PIC)은 위치 제약 없이 KV 재사용을 가능하게 하는 방법으로 제안되었지만, 기존 방식은 종종 상당한 정확도 저하를 초래하여 실제 적용에 제한이 있습니다. 이 문제를 해결하기 위해, 본 연구에서는 널리 사용되는 디코더 전용 LLM에 인코더를 재도입하고, PIC를 지원하도록 명시적으로 학습시키는 네이티브 PIC 방식을 제안합니다. 또한, 기존 추론 프레임워크와 원활하게 통합되는 PIC-인식 캐싱 시스템인 COMB를 개발했습니다. 실험 결과, COMB는 첫 번째 토큰까지의 시간(TTFT)을 51-94% 단축하고, 처리량을 3배 향상시키면서도 비교 가능한 정확도를 유지합니다. 또한, DeepSeek-V2-Lite-Chat을 사용하여 얻은 결과는 COMB가 다른 유형의 디코더 전용 LLM에도 적용 가능하다는 것을 보여줍니다. 본 연구의 코드는 https://github.com/shijuzhao/Comb에서 확인할 수 있습니다.

Original Abstract

The Key-Value (KV) cache of Large Language Models (LLMs) is prefix-based, making it highly inefficient for processing contexts retrieved in arbitrary order. Position-Independent Caching (PIC) has been proposed to enable KV reuse without positional constraints; however, existing approaches often incur substantial accuracy degradation, limiting their practical adoption. To address this issue, we propose native PIC by reintroducing the encoder to prevalent decoder-only LLMs and explicitly training it to support PIC. We further develop COMB, a PIC-aware caching system that integrates seamlessly with existing inference frameworks. Experimental results show that COMB reduces Time-to-First-Token (TTFT) by 51-94% and increases throughput by 3$\times$ with comparable accuracy. Furthermore, the quality improvement when using DeepSeek-V2-Lite-Chat demonstrates the applicability of COMB to other types of decoder-only LLMs. Our code is available at https://github.com/shijuzhao/Comb.

0 Citations
0 Influential
35.931471805599 Altmetric
179.7 Score

No Analysis Report Yet

This paper hasn't been analyzed by Gemini yet.

댓글

댓글을 작성하려면 로그인하세요.

아직 댓글이 없습니다. 첫 번째 댓글을 남겨보세요!