Key points are not available for this paper at this time.
Die Nutzung von Kurzmitteilungen in sozialen Medien und Instant Messaging hat in den letzten Jahren einen beliebten Kommunikationskanal dargestellt. Diese zunehmende Beliebtheit hat zu einem Anstieg von Bedrohungen durch Nachrichten wie Spam, Phishing oder Malware sowie anderen Bedrohungen geführt. Die Verarbeitung dieser Bedrohungen durch Kurzmitteilungen könnte zusätzliche Herausforderungen darstellen, wie das Vorhandensein von lexikalischen Varianten, SMS-ähnlichen Abkürzungen oder fortgeschrittenen Obfuskationen, die die Leistung traditioneller Filterlösungen beeinträchtigen können. Durch die Verwendung eines realen SMS-Datensatzes von einem großen Telekommunikationsanbieter aus den USA und einem Korpus sozialer Medien analysieren wir in diesem Papier die Wirksamkeit von maschinellen Lernfiltern, die auf linguistischen und Verhaltensmustern basieren, um Kurzmitteilungs-Spam und missbräuchliche Nutzer im Netzwerk zu erkennen. Wir haben auch verschiedene Ansätze zur Bewältigung der Herausforderungen von Kurzmitteilungen untersucht, wie Tokenisierung und Entitätserkennung, indem wir Techniken zur Textnormalisierung und Substring-Clustering verwendet haben. Die erzielten Ergebnisse zeigen die Gültigkeit der vorgeschlagenen Lösung, indem sie Baseline-Ansätze verbessern.
Mosquera et al. (Mon,) untersuchten diese Frage.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: