El rápido crecimiento de los usuarios de internet ha llevado a un aumento en los ataques de phishing, donde los atacantes crean URL engañosas para robar información sensible. Este estudio presenta un marco de aprendizaje automático en conjunto para detectar sitios web de phishing utilizando Procesamiento de Lenguaje Natural (NLP) y múltiples clasificadores, incluyendo Redes Neuronales Artificiales (ANN), Naïve Bayes (NB), Bosques Aleatorios (RF) y Máquinas de Soporte Vectorial (SVM). Al extraer características clave de las URL y aplicar técnicas de aprendizaje automático, el modelo propuesto mejora la precisión de detección. El análisis comparativo demuestra su efectividad, logrando un 98.4% de precisión al distinguir sitios de phishing de los legítimos. Este enfoque ofrece una solución proactiva para mitigar amenazas de seguridad en línea y proteger a los usuarios del fraude cibernético. Los ataques de phishing se han vuelto más sofisticados, utilizando URL engañosas para atacar a usuarios desprevenidos. Esta investigación introduce un modelo de detección basado en aprendizaje automático híbrido que mejora la precisión a través de un conjunto de clasificadores. El sistema utiliza Procesamiento de Lenguaje Natural (NLP) para extraer características críticas de las URL, que luego se analizan utilizando Redes Neuronales Artificiales (ANN), Naïve Bayes (NB), Bosques Aleatorios (RF) y Máquinas de Soporte Vectorial (SVM). Las técnicas de aprendizaje automático son particularmente efectivas para detectar ataques de phishing en cero horas y adaptarse a amenazas emergentes. Nuestra implementación logró un 98.4% de precisión en la clasificación de sitios web como de phishing o legítimos.
Walmik et al. (Jue,) estudiaron esta cuestión.