Los puntos clave no están disponibles para este artículo en este momento.
Presentamos un método que explota corpus no anotados para compensar la escasez de datos de entrenamiento anotados en las tareas de agrupación y etiquetado. Se recolectan y comprimen frecuencias de características de un gran corpus no anotado para su uso por clasificadores lineales. Los experimentos en dos tareas muestran que produce consistentemente mejoras significativas en el rendimiento.
Rie Kubota Ando (Jue,) estudió esta pregunta.