Key points are not available for this paper at this time.
Im Rahmen der statistischen maschinellen Übersetzung (SMT) werden Entsprechungen zwischen den Wörtern in der Quell- und Zielsprache aus bilingualen Korpora auf der Grundlage sogenannter Align-Modellen gelernt. Viele der statistischen Systeme verwenden wenig oder kein linguistisches Wissen, um die zugrunde liegenden Modelle zu strukturieren. In diesem Papier argumentieren wir, dass die Trainingsdaten typischerweise nicht groß genug sind, um die Vielfalt der unterschiedlichen Phänomene in natürlichen Sprachen ausreichend darzustellen, und dass SMT von der expliziten Einführung von Kenntnissen über die betrachteten Sprachen profitieren kann. Die Verbesserung der Übersetzungsergebnisse wird an zwei verschiedenen deutsch-englischen Korpora demonstriert.
Nießen et al. (Sat,) untersuchten diese Frage.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: