Key points are not available for this paper at this time.
Die Bewegungen von Ideen und Inhalten zwischen Orten und Sprachen sind zweifellos entscheidende Anliegen für Forscher des Informationszeitalters, und Twitter hat sich als zentrale, globale Plattform etabliert, auf der Hunderte Millionen von Menschen Wissen und Informationen teilen. Eine Vielzahl von Forschungen hat versucht, lokale und linguistische Metadaten aus Tweets zu erheben, um wichtige Fragen im Zusammenhang mit den 300 Millionen Tweets zu verstehen, die täglich durch die Plattform fließen. Allerdings wird ein Großteil dieser Arbeiten nur mit begrenztem Verständnis darüber durchgeführt, wie man am besten mit den räumlichen und linguistischen Kontexten umgeht, in denen die Informationen produziert wurden. Darüber hinaus sind bislang keine standardisierten, allgemein anerkannten Praktiken entstanden. Insofern untersucht dieses Papier die Zuverlässigkeit von Schlüsselmethoden zur Bestimmung von Sprache und Standort von Inhalten in Twitter. Es vergleicht drei automatisierte Sprachidentifikationspakete mit der Spracheinstellung der Twitter-Benutzeroberfläche und einer menschlichen Kodierung von Sprachen, um gemeinsame Quellen von Meinungsverschiedenheiten zu identifizieren. Das Papier zeigt auch, dass in vielen Fällen die von Nutzern eingegebenen Profilstandorte von den physischen Standorten abweichen, von denen die Nutzer tatsächlich twittern. Insofern können diese offenen, von Nutzern generierten Profilstandorte nicht als nützliche Proxys für die physischen Standorte verwendet werden, von denen Informationen auf Twitter veröffentlicht werden.
Graham et al. (Mon,) haben diese Frage untersucht.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: