November 13, 2014Open Access

La négation n'est pas résolue : généralisabilité contre optimisabilité dans le traitement du langage naturel clinique

Key Points

Key points are not available for this paper at this time.

Abstract

Une revue des travaux publiés dans le traitement du langage naturel clinique (NLP) peut suggérer que la tâche de détection de la négation a été "résolue". Ce travail propose qu'une solution optimisable n'est pas équivalente à une solution généralisable. Nous introduisons un nouveau module de polarité basé sur l'apprentissage automatique pour détecter la négation dans le texte clinique, et comparons son efficacité à travers différents domaines. En utilisant quatre corpus annotés manuellement de texte clinique, nous montrons que la performance de détection de la négation souffre lorsqu'il n'y a pas de développement dans le domaine (pour les méthodes manuelles) ou de données d'entraînement (pour les méthodes basées sur l'apprentissage automatique). Divers facteurs (par exemple, les directives d'annotation, les caractéristiques des entités nommées, la quantité de données, et le contexte lexical et syntaxique) jouent un rôle dans la difficulté de la généralisabilité, mais aucun n'explique complètement le phénomène. De plus, la généralisabilité reste un défi car il n'est pas clair s'il faut utiliser une seule source pour des données précises, combiner toutes les sources en un seul modèle, ou appliquer des méthodes d'adaptation de domaine. Le moyen le plus fiable d'améliorer la détection de la négation est d'annoter manuellement les données d'entraînement dans le domaine (ou, peut-être, de modifier manuellement les règles) ; c'est une stratégie pour optimiser la performance, plutôt que de la généraliser. Ces résultats suggèrent une direction pour les travaux futurs sur les méthodes d'adaptation au domaine et d'adaptation à la tâche pour le NLP clinique.

Bookmark

View Full Paper

Bookmark

View Full Paper

La négation n'est pas résolue : généralisabilité contre optimisabilité dans le traitement du langage naturel clinique

Key Points

Abstract

Cite This Study