Key points are not available for this paper at this time.
Traditionelles maschinelles Lernen trifft eine grundlegende Annahme: Die Trainings- und Testdaten sollten unter derselben Verteilung stehen. In vielen Fällen hält diese Annahme der identischen Verteilung jedoch nicht stand. Die Annahme könnte verletzt werden, wenn eine Aufgabe aus einer neuen Domäne kommt, während nur gelabelte Daten aus einer ähnlichen alten Domäne vorliegen. Das Labeln der neuen Daten kann kostspielig sein, und es wäre auch eine Verschwendung, alle alten Daten wegzuwerfen. In diesem Papier präsentieren wir ein neuartiges Transferlernraster namens TrAdaBoost, das auf Boosting-basierten Lernalgorithmen (Freund & Schapire, 1997) aufbaut. TrAdaBoost ermöglicht es den Benutzern, eine kleine Menge neu gelabelter Daten zu nutzen, um die alten Daten zu nutzen, um ein qualitativ hochwertiges Klassifizierungsmodell für die neuen Daten zu erstellen. Wir zeigen, dass diese Methode es uns ermöglicht, ein genaues Modell zu lernen, indem wir nur eine kleine Menge neuer Daten und eine große Menge alter Daten verwenden, selbst wenn die neuen Daten nicht ausreichen, um allein ein Modell zu trainieren. Wir zeigen, dass TrAdaBoost es ermöglicht, Wissen effektiv von den alten Daten auf die neuen zu übertragen. Die Effektivität unseres Algorithmus wird theoretisch und empirisch analysiert, um zu zeigen, dass unser iterativer Algorithmus gut konvergieren kann, um ein genaues Modell zu erhalten.
Dai et al. (Mittwoch) haben diese Frage untersucht.