Key points are not available for this paper at this time.
Com o aumento da consciência móvel nos últimos anos, a indústria de serviços de mensagens curtas (SMS) gerou bilhões de dólares em receita. No entanto, isso levou a um aumento na publicidade comercial indesejada ou spam enviado para telefones comuns, com partes da Ásia tendo até 30% das mensagens de conteúdo como spam em 2012. Um dos desafios na filtragem de spam por SMS é que requer um banco de dados abrangente e a utilidade limitada e o dialeto usado em SMS. Nesta extensão, os analistas usaram um banco de dados real de spam por SMS da loja de Aprendizado de Máquina da UCI e conectaram diferentes métodos de aprendizado de máquina após o pré-processamento e extração de marcação. Os resultados foram comparados e os principais algoritmos de filtragem de spam para o corpo da mensagem foram distinguidos. A reconstrução final usando validação cruzada de 10 vezes pareceu ter o classificador principal reduzindo mais da metade da taxa de erro total em comparação ao melhor comprovado em um artigo.
Anikait Kapoor (Mon,) estudou essa questão.