January 1, 2004Open Access

Explotación de corpus no anotados para el etiquetado y la agrupación

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

Presentamos un método que explota corpus no anotados para compensar la escasez de datos de entrenamiento anotados en las tareas de agrupación y etiquetado. Se recolectan y comprimen frecuencias de características de un gran corpus no anotado para su uso por clasificadores lineales. Los experimentos en dos tareas muestran que produce consistentemente mejoras significativas en el rendimiento.

Me gusta

Guardar

Ver artículo completo