En el mundo computacional, la ciencia de datos es la fuerza detrás de los recientes cambios dramáticos en las operaciones y tecnologías de la ciberseguridad. El secreto para hacer que un sistema de seguridad sea automatizado e inteligente es extraer patrones o conocimientos relacionados con incidentes de seguridad a partir de datos de ciberseguridad y construir modelos apropiados basados en datos. La ciencia de datos, también conocida como enfoques científicos diversos, técnicas de aprendizaje automático, procesos y sistemas, es el estudio de ocurrencias reales mediante el uso de datos. Debido a sus cualidades distintivas, como la flexibilidad, escalabilidad y la capacidad de adaptarse rápidamente a nuevos obstáculos desconocidos, las técnicas de aprendizaje automático se han utilizado en muchos campos científicos. Debido a avances notables en redes sociales, tecnologías de la nube y web, banca en línea, entornos móviles, redes inteligentes, etc., la ciberseguridad es un sector en rápida expansión que requiere mucha atención. Una amplia gama de problemas de seguridad informática han sido abordados efectivamente por diversas técnicas de aprendizaje automático. Este artículo abarca varias aplicaciones de aprendizaje automático en ciberseguridad. La detección de phishing, la detección de intrusiones en la red, autenticación mediante dinámica de pulsaciones de teclas, criptografía, pruebas de interacción humana, detección de spam en redes sociales, perfiles de consumo de energía de medidores inteligentes y preocupaciones de seguridad con las técnicas de aprendizaje automático en sí mismas están todas cubiertas en este estudio. La metodología implica la recopilación de un gran conjunto de datos de instancias de phishing y legítimas, la extracción de características relevantes como encabezados de correo electrónico, contenido y URL, y el entrenamiento de un modelo de aprendizaje automático utilizando algoritmos de aprendizaje supervisado. Los modelos de aprendizaje automático pueden identificar efectivamente correos electrónicos y sitios web de phishing con alta precisión y bajas tasas de falsos positivos. Para mejorar la detección de phishing, se recomienda actualizar continuamente el conjunto de datos de entrenamiento para incluir nuevas técnicas de phishing y emplear métodos en conjunto que combinen múltiples modelos de aprendizaje automático para un mejor rendimiento.
Jasmin Praful Bharadiya (Thu,) estudió esta cuestión.