Escalado de LLMs de Largo Contexto mediante Optimización Unificada de Caché KV: Un Estudio Comparativo de Atención Paginada y Cuantización | Synapse