Key points are not available for this paper at this time.
Die grundlegendste Annahme in der statistischen Lerntheorie ist, dass Trainingsdaten und Testdaten aus derselben zugrunde liegenden Verteilung gezogen werden. Leider wird in vielen Anwendungen die "in-domain" Testdaten aus einer Verteilung gezogen, die verwandt, aber nicht identisch mit der "out-of-domain" Verteilung der Trainingsdaten ist. Wir betrachten den häufigen Fall, in dem gekennzeichnete out-of-domain Daten reichlich vorhanden sind, während gekennzeichnete in-domain Daten knapp sind. Wir führen eine statistische Formulierung dieses Problems in Form eines einfachen Mischmodells ein und präsentieren eine Instanziierung dieses Rahmens für maximale Entropie-Klassifikatoren und ihre linearen Ketten-Gegenstücke. Wir stellen effiziente Inferenzalgorithmen für diesen speziellen Fall auf der Grundlage der Technik der bedingten Erwartungsmaximierung vor. Unsere experimentellen Ergebnisse zeigen, dass unser Ansatz zu einer verbesserten Leistung bei drei realen Aufgaben auf vier verschiedenen Datensätzen aus dem Bereich der natürlichen Sprachverarbeitung führt.
Daumé et al. (Mi,) untersuchten diese Frage.