Sozialwissenschaftler, Wissenschaftler der digitalen Geisteswissenschaften und Fachleute aus der Industrie nutzen jetzt regelmäßig großangelegte Dokumentenkorpora. Ein großer Datensatz von Texten, der eine Fülle von Informationen bietet, ist allein nicht ausreichend, um bedeutungsvolle Erkenntnisse zu gewinnen. Es ist entscheidend, den Datensatz mit gut definierten Forschungsfragen zu verfolgen, die den analytischen Prozess leiten und die Relevanz der Ergebnisse sicherstellen. Darüber hinaus erfordert die Ableitung bedeutungsvoller Antworten die Anwendung geeigneter Methoden, die auf die Forschungsziele abgestimmt sind. Neben methodologischer Strenge müssen Wissenschaftler die Einschränkungen der Validität des Datensatzes kritisch bewerten. Dies umfasst die Bewertung der Genauigkeit, Zuverlässigkeit und Vollständigkeit der Daten sowie das Erkennen etwaiger inhärenter Vorurteile. Das Buch zielt darauf ab, zu veranschaulichen, wie man "Text als Daten" für sozialwissenschaftliche Aufgaben und Probleme behandelt. Es hat eine sechsTeilstruktur, kombiniert mit mehreren Kapiteln und Unterkapiteln. Jeder Teil ist um fünf grundlegende Konzepte strukturiert: Repräsentation, Entdeckung, Messung, Vorhersage und kausale Inferenz. Dadurch dient es als umfassender Leitfaden für Forscher, der die Möglichkeiten und Grenzen der Methoden zur Textdatenauswertung skizziert.
Tamás Varga (Mon,) hat diese Frage untersucht.