Key points are not available for this paper at this time.
Ein wichtiges Merkmal des Cloud-Computing ist seine Elastizität, d.h. die Fähigkeit, die Ressourcen-Kapazität dynamisch gemäß der aktuellen Systemlast anzupassen. Autoskalierung ist eine Herausforderung, da sie zwei widersprüchliche Ziele berücksichtigen muss: die Minimierung der Systemkapazität, die den Nutzern zur Verfügung steht, und die Maximierung von QoS, was typischerweise in kurze Antwortzeiten übersetzt wird. Aktuelle Autoskalierungstechniken basieren ausschließlich auf Lastprognosen und ignorieren die Wahrnehmung, die Nutzer von Cloud-Diensten haben. Infolgedessen neigen Anbieter dazu, ein Volumen an Ressourcen bereitzustellen, das erheblich größer ist als notwendig, um die Nutzer zufrieden zu stellen. In diesem Artikel schlagen wir einen Planungsalgorithmus und eine Technik zur Auslösung der Autoskalierung vor, die die Geduld der Nutzer erkundet, um kritische Zeiten zu identifizieren, in denen Autoskalierung erforderlich ist, und das geeignete Volumen an Kapazität, mit dem die Cloud-Plattform entweder erweitert oder verkleinert werden sollte. Die vorgeschlagene Technik unterstützt Dienstanbieter dabei, die Kosten im Zusammenhang mit der Ressourcenzuteilung zu senken, während sie denselben QoS für die Nutzer aufrechterhalten. Unsere Experimente zeigen, dass es möglich ist, die Ressourcennutzung um bis zu etwa 8 % im Vergleich zur Autoskalierung auf der Grundlage der Systemauslastung zu reduzieren.
Cunha et al. (Sun,) untersuchten diese Frage.