덜 생각하고 더 스마트하게 저장하기: 대형 추론 모델에서 유형 인식 KV 캐시 양자화에 대한 이론적 프레임워크 | Synapse