Key points are not available for this paper at this time.
Investigamos um modelo LSTM estruturado em lattice para NER Chinês, que codifica uma sequência de caracteres de entrada, bem como todas as palavras potenciais que correspondem a um léxico. Comparado com métodos baseados em caracteres, nosso modelo aproveita explicitamente informações sobre palavras e sequências de palavras. Comparado com métodos baseados em palavras, o LSTM em lattice não sofre de erros de segmentação. Células recorrentes com portões permitem que nosso modelo escolha os caracteres e palavras mais relevantes de uma sentença para melhores resultados de NER. Experimentos em diversos conjuntos de dados mostram que o LSTM em lattice supera tanto as linhas de base baseadas em palavras quanto as baseadas em caracteres, alcançando os melhores resultados.
Zhang et al. (Mon,) estudaram esta questão.