April 1, 2015Open Access

Auto-apprentissage asymétrique pour faire face à la dérive de spam sur Twitter

Key Points

Key points are not available for this paper at this time.

Abstract

Le spam est devenu un problème critique sur Twitter. Afin d'arrêter les spammers, les entreprises de sécurité appliquent des services de mise sur liste noire pour filtrer les liens de spam. Cependant, plus de 90 % des victimes visiteront un nouveau lien malveillant avant qu'il ne soit bloqué par les listes noires. Pour éliminer la limitation des listes noires, les chercheurs ont proposé un certain nombre de mécanismes basés sur des caractéristiques statistiques, et ont appliqué des techniques d'apprentissage automatique pour détecter le spam sur Twitter. Dans notre grand ensemble de données labellisées, nous observons que les propriétés statistiques des tweets de spam varient dans le temps, et donc la performance des classificateurs basés sur l'apprentissage automatique existants est médiocre. Ce phénomène est appelé « Dérive de spam Twitter ». Afin de relever ce défi, nous effectuons une analyse approfondie de 1 million de tweets de spam et de 1 million de tweets non-spam, et proposons une approche d'auto-apprentissage asymétrique (ASL). L'ASL proposée peut découvrir de nouvelles informations sur le spam Twitter modifié et les intégrer dans le processus de formation des classificateurs. Un certain nombre d'expériences sont réalisées pour évaluer l'approche ASL. Les résultats montrent que l'approche ASL peut être utilisée pour améliorer considérablement la précision de détection du spam en utilisant des algorithmes d'apprentissage automatique traditionnels.

Auto-apprentissage asymétrique pour faire face à la dérive de spam sur Twitter

Key Points

Abstract

Cite This Study

Also Consider

Also Consider