August 18, 2014Open Access

Zur Erkennung von Missbrauch in Kurzmitteilungen durch linguistische und Verhaltensmuster

Key Points

Key points are not available for this paper at this time.

Abstract

Die Nutzung von Kurzmitteilungen in sozialen Medien und Instant Messaging hat in den letzten Jahren einen beliebten Kommunikationskanal dargestellt. Diese zunehmende Beliebtheit hat zu einem Anstieg von Bedrohungen durch Nachrichten wie Spam, Phishing oder Malware sowie anderen Bedrohungen geführt. Die Verarbeitung dieser Bedrohungen durch Kurzmitteilungen könnte zusätzliche Herausforderungen darstellen, wie das Vorhandensein von lexikalischen Varianten, SMS-ähnlichen Abkürzungen oder fortgeschrittenen Obfuskationen, die die Leistung traditioneller Filterlösungen beeinträchtigen können. Durch die Verwendung eines realen SMS-Datensatzes von einem großen Telekommunikationsanbieter aus den USA und einem Korpus sozialer Medien analysieren wir in diesem Papier die Wirksamkeit von maschinellen Lernfiltern, die auf linguistischen und Verhaltensmustern basieren, um Kurzmitteilungs-Spam und missbräuchliche Nutzer im Netzwerk zu erkennen. Wir haben auch verschiedene Ansätze zur Bewältigung der Herausforderungen von Kurzmitteilungen untersucht, wie Tokenisierung und Entitätserkennung, indem wir Techniken zur Textnormalisierung und Substring-Clustering verwendet haben. Die erzielten Ergebnisse zeigen die Gültigkeit der vorgeschlagenen Lösung, indem sie Baseline-Ansätze verbessern.

Bookmark

View Full Paper