Fehlende Werte in multivariaten Zeitseriendaten können die Leistung von maschinellem Lernen beeinträchtigen und Verzerrungen einführen. Diese Lücken entstehen durch Sensorfehler, Ausfälle und menschliche Fehler und werden typischerweise durch Datenimputation adressiert. Frühere Arbeiten haben die Imputation fehlender Daten in zufälligen, vollständigen Ausfällen und Prognoseszenarien behandelt. Das aktuelle Papier befasst sich mit einem allgemeineren fehlenden Muster, das wir "partieller Ausfall" nennen, wobei eine Teilmenge von Merkmalen für aufeinanderfolgende Zeitpunkte fehlt. Wir führen einen zweistufigen Imputationsprozess ein, der Selbstaufmerksamkeit und Diffusionsprozesse nutzt, um Merkmals- und zeitliche Korrelationen zu modellieren. Besonders bemerkenswert ist, dass unser Modell fehlende Daten während des Trainings effektiv behandelt, die Anpassungsfähigkeit verbessert und eine zuverlässige Imputation und Leistung gewährleistet, selbst bei unvollständigen Datensätzen. Unsere Experimente mit Benchmark- und zwei realen Zeitseriendatensätzen zeigen, dass unser Modell die bisherigen Stand der Technik in Szenarien mit partiellen Ausfällen übertrifft und eine bessere Skalierbarkeit aufweist.
Islam et al. (Mon,) haben diese Frage untersucht.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: