Los puntos clave no están disponibles para este artículo en este momento.
Los usuarios de información dependen en gran medida del sistema de correos electrónicos como una de las principales fuentes de comunicación. Su importancia y uso están en constante crecimiento a pesar de la evolución de las aplicaciones móviles, redes sociales, etc. Los correos electrónicos se utilizan tanto a nivel personal como profesional. Pueden considerarse documentos oficiales en la comunicación entre usuarios. La minería y el análisis de datos de correos electrónicos se pueden llevar a cabo para varios propósitos, como: detección y clasificación de spam, clasificación de temas, etc. En este artículo, se utiliza un gran conjunto de correos electrónicos personales con el propósito de clasificaciones de carpetas y temas. Se desarrollan algoritmos para realizar agrupamiento y clasificación para esta gran colección de texto. La clasificación basada en NGram se muestra como la mejor para tal colección de texto grande, especialmente ya que el texto es bilingüe (es decir, con contenido en inglés y árabe).
Alsmadi et al. (Thu,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: