Los puntos clave no están disponibles para este artículo en este momento.
Se describe un nuevo método para la indexación y recuperación automática. El enfoque es aprovechar la estructura implícita de orden superior en la asociación de términos con documentos (“estructura semántica”) con el fin de mejorar la detección de documentos relevantes basándose en términos encontrados en las consultas. La técnica particular utilizada es la descomposición en valores singulares, en la que una gran matriz de términos por documentos se descompone en un conjunto de aproximadamente 100 factores ortogonales a partir de los cuales la matriz original puede ser aproximada mediante combinación lineal. Los documentos se representan mediante aproximadamente 100 vectores de ítems de pesos de factores. Las consultas se representan como vectores de pseudo-documentos formados a partir de combinaciones ponderadas de términos, y se devuelven documentos con valores coseno supratérmino. Las pruebas iniciales encuentran que este método completamente automático para la recuperación es prometedor. © 1990 John Wiley & Sons, Inc.
Deerwester et al. (Sat,) estudiaron esta cuestión.