Key points are not available for this paper at this time.
O Reconhecimento de Entidades Nomeadas (NER) é uma etapa fundamental e pivotal no desenvolvimento de vários sistemas de suporte baseados em conhecimento, incluindo recuperação de conhecimento e sistemas de perguntas e respostas. No domínio das doenças suínas, modelos chineses de NER enfrentam vários desafios, como a escassez de dados anotados, vocabulário específico do domínio, categorias de entidades diversas e limites de entidades ambíguos. Para abordar esses desafios, propomos o PDCNER, um método de Reconhecimento de Entidades Nomeadas para Doenças Suínas em Chinês que utiliza BERT aprimorado por léxico e aprendizado contrastivo. Primeiramente, construímos um léxico específico do domínio e pré-treinamos embeddings de palavras no domínio das doenças suínas. Em segundo lugar, integramos informações léxicas sobre doenças suínas nas camadas inferiores do BERT usando uma camada de Adaptador Léxico, que emprega sequências de pares de caracteres e palavras. Em terceiro lugar, para aprimorar a representação de características, propomos uma camada de perda contrastiva aprimorada por léxico sobre o BERT. Finalmente, uma camada de Campo Aleatório Condicional (CRF) é utilizada como o decodificador do modelo. Os resultados experimentais mostram que nosso modelo proposto demonstra desempenho superior em relação a vários modelos principais, alcançando uma precisão de 87,76%, uma revocação de 86,97% e uma pontuação F1 de 87,36%. O modelo proposto supera BERT-BiLSTM-CRF e LEBERT em 14,05% e 6,8%, respectivamente, com apenas 10% das amostras disponíveis, demonstrando sua robustez em cenários de escassez de dados. Além disso, o modelo exibe generalizabilidade em conjuntos de dados disponíveis publicamente. Nosso trabalho fornece suporte técnico confiável para a extração de informações sobre doenças suínas em chinês e pode ser facilmente estendido a outros domínios, facilitando a adaptação contínua para a identificação de entidades nomeadas em diversos contextos.
Peng et al. (Qui,) estudaram esta questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: