Los puntos clave no están disponibles para este artículo en este momento.
La medición de similitud textual tiene como objetivo encontrar la comunidad existente entre documentos de texto, lo cual es fundamental para la mayoría de problemas de extracción de información, recuperación de información y minería de texto. La similitud coseno basada en la distancia euclidiana es actualmente una de las mediciones de similitud más utilizadas. Sin embargo, la distancia euclidiana generalmente no es un métrico efectivo para manejar probabilidades, que a menudo se utilizan en análisis de texto. En este artículo, proponemos una nueva medida de similitud basada en la similitud sqrt-coseno. Aplicamos la similitud sqrt-coseno mejorada propuesta a una variedad de tareas de comprensión de documentos, como clasificación de texto, agrupamiento y búsqueda de consultas. Luego se llevan a cabo experimentos exhaustivos para evaluar nuestra nueva medición de similitud en comparación con métodos existentes. Estos resultados experimentales muestran que nuestro método propuesto es, de hecho, efectivo.
Sohangir et al. (Tue,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: