Mikroservices zerlegen Anwendungen in unabhängige Module, was eine horizontale Skalierung von Engpässen ohne Unterbrechungen ermöglicht. Kubernetes verwaltet Anfragen und verwendet HPA, um Pods basierend auf Schwellenwerten zu skalieren. Aktuelle HPA-Module, die effizient mit Ressourcenmetriken und Echtzeitdaten arbeiten, weisen eine umfassende Analyse der Dienstqualität auf. Plötzliche Verkehrsspitzen können Instabilität verursachen, die durch häufiges Skalieren oder eine verschlechterte Dienstqualität aufgrund verzögerter Antworten entsteht. Diese Studie schlägt ein modulares HPA mit einem Vorhersagemodul für die Dienstqualität, einem Filtermodul für gültige Optionen und einem Stabilitätsmodul zur Balance von Leistung und Konsistenz vor. Die Ergebnisse zeigen ähnliche CPU-Nutzung und Reaktionszeiten wie die Basiswerte, jedoch weniger Skalierungsaktionen, was Stabilität und Effizienz verbessert.
Jang et al. (Mon,) haben diese Frage untersucht.