Key points are not available for this paper at this time.
Ao resolver o problema do cálculo do peso das características para a classificação automática de texto, usamos o algoritmo TF-IDF, que é o mais amplamente utilizado. Embora o algoritmo seja amplamente utilizado, existe um problema em que as categorias de características têm pesos diferentes ao calcular os pesos. Este artigo propõe um algoritmo TF-IDF melhorado (TF-IDCRF) que considera as relações entre classes para completar a classificação de textos. Modificando as fórmulas de cálculo do IDF para corrigir o problema de classificação insuficiente das categorias de características, o algoritmo de classificação de Bayes ingênuo é usado para completar a classificação. Por fim, o algoritmo proposto é comparado com outros dois algoritmos TF-IDF melhorados. Os resultados dos três indicadores de avaliação de classificação de texto mostram que o algoritmo proposto tem certas vantagens na classificação de texto.
Fan et al. (Mon,) estudaram esta questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: