What question did this study set out to answer?

El objetivo es introducir un nuevo enfoque para el modelado de temas que incorpore covariables a nivel de documento mientras es computacionalmente eficiente.

March 10, 2026Open Access

Pruebas de Hipótesis sobre los Efectos de Covariables en Temas de Discurso

Puntos clave

El objetivo es introducir un nuevo enfoque para el modelado de temas que incorpore covariables a nivel de documento mientras es computacionalmente eficiente.
Se introdujo un enfoque de modelado de temas utilizando factorización de matriz no negativa con técnicas de regresión.
Se asumió que los datos provienen de una distribución fija desconocida para el análisis estadístico.
Se aplicó remuestreo no paramétrico para la cuantificación de incertidumbre.
Se demostró que el método propuesto es más rápido y más interpretable que los modelos tradicionales.
Se mostró una mejor justificación inferencial al analizar el discurso relacionado con las cervezas canadienses.

Resumen

RESUMEN Presentamos un enfoque para el modelado de temas con covariables a nivel de documento que sigue siendo manejable ante grandes corpus de texto. Esto se logra al desestimar el papel de la estimación de parámetros en un modelo probabilístico subyacente, asumiendo en cambio que los datos provienen de una distribución fija pero desconocida cuyos funcionales estadísticos son de interés. Proponemos combinar una formulación convexa de la factorización de matriz no negativa con técnicas de regresión estándar como una estimación rápida y útil de dicho funcional. La cuantificación de incertidumbre se puede lograr mediante métodos de remuestreo no paramétricos sobre este esquema. Esto contrasta con los paradigmas populares de modelado de temas, que postulan un modelo generativo complejo y a menudo difícil de ajustar de los datos. Argumentamos que el enfoque simple y no paramétrico aquí defendido es más rápido, más interpretable y goza de una mejor justificación inferencial que dichos modelos generativos. Finalmente, nuestros métodos son demostrados con una aplicación que analiza los efectos de covariables en el discurso de los sabores atribuidos a cervezas canadienses.

Leer artículo completoexternamente

Me gusta

Guardar

Ver artículo completo