Key points are not available for this paper at this time.
Dieses Papier beschreibt neue Methoden zur automatischen Extraktion von Dokumenten für Screening-Zwecke, d.h. die computergestützte Auswahl von Sätzen, die das größte Potenzial haben, dem Leser den Inhalt des Dokuments zu vermitteln. Während frühere Arbeiten sich auf einen Aspekt der Satzbedeutung konzentrierten, nämlich das Vorhandensein von hochfrequenten Inhaltswörtern (Schlüsselwörter), behandeln die hier beschriebenen Methoden auch drei zusätzliche Komponenten: pragmatische Wörter (Hinweiswörter); Titel- und Überschriftwörter; sowie strukturelle Indikatoren (Satzposition). Die Forschung hat zu einem Betriebssystem und einer Forschungsmethodik geführt. Das Extraktionssystem ist parametrisiert, um den Einfluss der oben genannten vier Komponenten zu steuern und zu variieren. Die Forschungsmethodik umfasst Verfahren zur Erstellung der erforderlichen Wörterbücher, zur Festlegung der Kontrollparameter und zur vergleichenden Bewertung der automatischen Extraktionen mit manuell erstellten Extraktionen. Die Ergebnisse zeigen, dass die drei neu vorgeschlagenen Komponenten die Frequenzkomponente bei der Herstellung besserer Extraktionen dominieren.
Building similarity graph...
Analyzing shared references across papers
Loading...
H. P. Edmundson
National Physical Laboratory
Journal of the ACM
University of Maryland, College Park
Building similarity graph...
Analyzing shared references across papers
Loading...
H. P. Edmundson (Tue,) untersuchte diese Frage.
synapsesocial.com/papers/6a0eb6e5a14f152feaf9bf19 — DOI: https://doi.org/10.1145/321510.321519