Key points are not available for this paper at this time.
Récemment, plusieurs modèles de langage de grande taille (LLMs) spécialisés et adaptés aux instructions pour la reconnaissance des entités nommées (NER) ont émergé. Comparés aux approches NER traditionnelles, ces modèles possèdent de fortes capacités de généralisation. Les LLMs existants se concentrent principalement sur la NER zéro-shot dans des distributions hors domaine, étant ajustés sur un grand nombre de classes d'entités qui se chevauchent souvent fortement ou complètement avec les ensembles de test. Dans ce travail, nous proposons SLIMER, une approche conçue pour s'attaquer à des étiquettes d'entités nommées jamais vues auparavant en instruisant le modèle sur moins d'exemples et en s'appuyant sur une invite enrichie de définitions et de directives. Les expériences montrent que les définitions et directives produisent de meilleures performances, un apprentissage plus rapide et plus robuste, en particulier lors de l'étiquetage d'entités nommées non vues. De plus, SLIMER affiche des performances comparables aux approches à la pointe de la technologie dans la NER zéro-shot hors domaine, tout en étant entraîné sur un ensemble d'étiquettes réduit.
Zamai et al. (Mon,) ont étudié cette question.