Key points are not available for this paper at this time.
Um grande número de informações textuais digitais é gerado a cada dia. Pesquisar, gerenciar e explorar efetivamente os dados textuais se tornou uma tarefa principal. Neste artigo, primeiro representamos uma introdução à mineração de texto e a um modelo de tópicos probabilístico chamado Alocação Dirichlet Latente. Em seguida, são propostos dois experimentos - modelagem de tópicos de artigos da Wikipedia e tweets de usuários. O primeiro constrói um modelo de tópicos de documentos, visando uma solução de perspectiva de tópico para pesquisar, explorar e recomendar artigos. O segundo estabelece um modelo de tópicos de usuários, fornecendo uma pesquisa e análise completas sobre o interesse dos usuários do Twitter. O processo experimental, incluindo coleta de dados, pré-processamento de dados e treinamento do modelo, está totalmente documentado e comentado. Além disso, a conclusão e a aplicação deste artigo podem ser uma ferramenta computacional útil para pesquisas sociais e empresariais.
Zhou et al. (Sáb,) estudaram essa questão.