Key points are not available for this paper at this time.
Da Online-Dienste immer beliebter werden, ist das Incident-Management zu einer kritischen Aufgabe geworden, die darauf abzielt, die Ausfallzeiten der Dienste zu minimieren und eine hohe Qualität der bereitgestellten Dienste zu gewährleisten. In der Praxis wird das Incident-Management durch die Analyse einer riesigen Menge an Überwachungsdaten durchgeführt, die zur Laufzeit eines Dienstes gesammelt werden. Dieses datengestützte Incident-Management steht vor mehreren wesentlichen Herausforderungen, wie dem großen Datenvolumen, dem komplexen Problembereich und unvollständigem Wissen. Um diese Herausforderungen zu bewältigen, führten wir eine zweijährige Forschung zur Software-Analytik durch, in der wir eine Reihe neuartiger datengestützter Techniken entwarfen und ein industrielles System namens Service Analysis Studio (SAS) entwickelten, das auf reale Szenarien in einem großangelegten Online-Dienst von Microsoft abzielt. SAS wurde in weltweit verteilte Produkt-Datencenter eingesetzt und von Bereitschaftsingenieuren für das Incident-Management umfangreich genutzt. Dieses Papier teilt unsere Erfahrungen über die Nutzung von Software-Analytik zur Lösung der Schmerzpunkte der Ingenieure im Incident-Management, die entwickelten Datenanalysetechniken und die Lektionen, die aus dem Prozess der Forschungsentwicklung und des Technologietransfers gelernt wurden.
Lou et al. (Fr,) haben diese Frage untersucht.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: