Los puntos clave no están disponibles para este artículo en este momento.
La Extracción de Información (IE) es un proceso transformador que convierte datos de texto no estructurados en un formato estructurado mediante la aplicación de metodologías de extracción de entidades y relaciones (RE). La identificación de la relación entre un par de entidades juega un papel crucial dentro de este marco. A pesar de la existencia de varias técnicas para la extracción de relaciones, su eficacia depende en gran medida del acceso a datos etiquetados y de recursos computacionales sustanciales. Al abordar estos desafíos, los Modelos de Lenguaje Grande (LLMs) emergen como soluciones prometedoras; sin embargo, podrían devolver respuestas alucinadas debido a sus propios datos de entrenamiento. Para superar estas limitaciones, se propone en este trabajo la Extracción de Relaciones basada en Generación Aumentada por Recuperación (RAG4RE), ofreciendo un camino para mejorar el rendimiento de las tareas de extracción de relaciones. Este trabajo evaluó la efectividad de nuestro enfoque RAG4RE utilizando diferentes LLMs. A través de la utilización de benchmarks establecidos, como TACRED, TACREV, Re-TACRED y conjuntos de datos SemEval RE, nuestro objetivo es evaluar de manera integral la eficacia de nuestro enfoque RAG4RE. En particular, aprovechamos modelos de LLM prominentes, incluyendo Flan T5, Llama2 y Mistral en nuestra investigación. Los resultados de nuestro estudio demuestran que nuestro enfoque RAG4RE supera el rendimiento de los enfoques tradicionales de RE basados únicamente en LLMs, siendo particularmente evidente en el conjunto de datos TACRED y sus variaciones. Además, nuestro enfoque exhibe un rendimiento notable en comparación con metodologías de RE anteriores en ambos conjuntos de datos TACRED y TACREV, subrayando su eficacia y potencial para avanzar en tareas de RE en procesamiento de lenguaje natural.
Efeoğlu et al. (Sat,) estudiaron esta cuestión.