Los datos estructurados tienen un formato estandarizado para un fácil acceso, organización y categorización. Sin embargo, aproximadamente el 95 % de los datos, como archivos de texto o reseñas en línea, son no estructurados, y estos textos no tienen reglas estándar. El análisis de datos no estructurados, especialmente cuando la cantidad de datos a examinar es considerable, requiere un esfuerzo, costo y tiempo considerables, y los métodos estadísticos clásicos a menudo son insuficientes. Los modelos de Transformers, los últimos modelos tecnológicos en procesamiento de lenguaje natural (NLP), son los mejores candidatos para superar estos límites. En este artículo, proponemos la solución basada en el modelo de representaciones de codificadores bidireccionales de transformers (BERT) para el análisis de sentimientos de reseñas de consumidores. El conjunto de datos comprende 10,975 reseñas de consumidores sobre productos tecnológicos de una plataforma de comercio electrónico y fue transformado en un conjunto de datos estructurado utilizando preprocesamiento de datos. Luego, comparamos el rendimiento del modelo de transformer BERT con modelos de aprendizaje profundo, específicamente redes neuronales convolucionales (CNN), memoria a corto y largo plazo (LSTM) y memoria a corto y largo plazo bidireccional (B-LSTM). Los resultados experimentales confirmaron que el modelo de transformer BERT logró un kappa superior del 96.6 % y una precisión general del 97.78 % para la clasificación múltiple de reseñas de consumidores. El modelo basado en transformers propuesto supera a los modelos de última generación, proporcionando una solución confiable y eficiente.
Hanife Göker (Fri,) estudió esta cuestión.