Key points are not available for this paper at this time.
Wir präsentieren einen neuartigen Ansatz zur Visualisierung und Erkundung unstrukturierter Texte. Die zugrunde liegende Technologie, genannt TOPIC-O-GRAPHY/sup TM/, wendet Wavelet-Transformationen auf ein benutzerdefiniertes digitales Signal an, das aus Wörtern innerhalb eines Dokuments besteht. Die resultierende multiresolutionale Wavelet-Energie wird verwendet, um die Merkmale des narrativen Flusses im Frequenzbereich zu analysieren, wie z. B. Themenwechsel, die dann mit dem gesamten thematischen Inhalt des Textdokuments unter Verwendung statistischer Methoden in Beziehung gesetzt werden. Die thematischen Eigenschaften eines Dokuments können in unterschiedlichen Details analysiert werden, von abschnittsweisen Textpartitionen bis hin zu Partitionen, die aus wenigen Wörtern bestehen. Mit dieser Technologie entwickeln wir einen Prototyp eines Visualisierungssystems namens TOPIC ISLANDS, um ein Dokument zu durchstöbern, unscharfe Dokumentumrisse zu erzeugen, Texte nach Detailgrad und Benutzerinteressen zusammenzufassen, sinnvolle Unterdokumente zu definieren, den Textinhalt abzufragen und Zusammenfassungen der Themenentwicklung bereitzustellen.
Miller et al. (Donnerstag) haben diese Frage untersucht.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: