Key points are not available for this paper at this time.
In modernen Cloud-Umgebungen sind Container-Orchestrierungswerkzeuge unerlässlich für das effektive Management vielfältiger Arbeitslasten und Dienste, und Kubernetes ist zum De-facto-Standardwerkzeug für die Automatisierung der Bereitstellung, Skalierung und des Betriebs containerisierter Anwendungen geworden. Während Kubernetes eine wichtige Rolle bei der Optimierung und Verwaltung der Bereitstellung diverser Dienste und Anwendungen spielt, kann der Standard-Scheduling-Ansatz, der nicht für alle Arten von Arbeitslasten optimiert ist, häufig zu schlechter Leistung und verschwendeten Ressourcen führen. Dies gilt insbesondere in Umgebungen mit komplexen Interaktionen zwischen Diensten, wie z. B. Mikrodienstenarchitekturen. Der herkömmliche Kubernetes-Scheduler trifft Scheduling-Entscheidungen basierend auf CPU- und Speicherauslastung, aber die Einschränkung dieses Arrangements besteht darin, dass es die Leistungs- und Ressourceneffizienz der Anwendung nicht vollständig berücksichtigt. Infolgedessen steigt die Kommunikationslatenz zwischen den Diensten, und die Gesamtleistung des Systems leidet. Daher ist eine ausgeklügeltere und adaptive Scheduling-Methode erforderlich. In dieser Arbeit schlagen wir eine adaptive Optimierungstechnik für die Platzierung von Pods unter Verwendung einer mehrstufigen Inspektion vor, um diese Probleme zu adressieren. Die vorgeschlagene Technik sammelt und analysiert mehrstufige Daten, um die Anwendungsleistung und Ressourceneffizienz zu verbessern, die vom Standard-Kubernetes-Scheduler übersehen werden. Sie leitet optimale Platzierungen basierend auf der Kopplung und den Abhängigkeiten zwischen Pods ab, was zu einer effizienteren Ressourcennutzung und besseren Leistung führt. Um die Leistung der vorgeschlagenen Methode zu validieren, haben wir einen Kubernetes-Cluster in einer virtualisierten Umgebung konfiguriert und Experimente mit einer Benchmark-Anwendung mit einer Mikrodienstenarchitektur durchgeführt. Die experimentellen Ergebnisse zeigen, dass die vorgeschlagene Methode den bestehenden Kubernetes-Scheduler übertrifft, indem sie die durchschnittliche Reaktionszeit um bis zu 11,5 % reduziert und die Anzahl der pro Sekunde verarbeiteten Anfragen um bis zu 10,04 % erhöht. Dies zeigt, dass die vorgeschlagene Methode die Kommunikationslatenz zwischen Pods minimiert und die ressourcische Nutzung im System verbessert. Diese Forschung zielt darauf ab, die Anwendungsleistung zu optimieren und die Ressourceneffizienz in cloud-nativen Umgebungen zu erhöhen, und die vorgeschlagene Technik kann in Zukunft auf verschiedene Cloud-Umgebungen und Arbeitslasten angewendet werden, um allgemeinere Optimierungen zu bieten. Dies wird voraussichtlich zur Erhöhung der operationellen Effizienz der Cloud-Infrastruktur beitragen und die Servicequalität verbessern.
Roh et al. (Thu,) haben diese Frage untersucht.