Los puntos clave no están disponibles para este artículo en este momento.
Resumen Se ofrecen nuevas perspectivas sobre por qué el problema de detectar valores atípicos multivariantes puede ser complicado y por qué la dificultad aumenta con la dimensión de los datos. Se describen mejoras significativas en los métodos para detectar valores atípicos, y extensos experimentos de simulación demuestran que un método híbrido amplía los límites prácticos de las capacidades de detección de valores atípicos. Basado en resultados de simulación y ejemplos de la literatura, se investiga la cuestión de qué niveles de contaminación pueden ser detectados por este algoritmo en función de la dimensión, tiempo de cómputo, tamaño de muestra, fracción de contaminación y distancia de la contaminación del cuerpo principal de datos. El software para implementar los métodos está disponible por parte de los autores y STATLIB. Palabras clave: Búsqueda heurística, estimación M, determinante de covarianza mínimo, estimación S.
Rocke et al. (Sun,) estudiaron esta cuestión.