Los puntos clave no están disponibles para este artículo en este momento.
Desarrollar sistemas de visión robustos e interpretables es un paso crucial hacia una inteligencia artificial confiable. A este respecto, un paradigma prometedor considera incrustar estructuras invariantes requeridas por la tarea, por ejemplo, la invariancia geométrica, en la representación fundamental de la imagen. Sin embargo, tales representaciones invariantes típicamente exhiben una discriminabilidad limitada, lo que restringe sus aplicaciones en tareas de visión confiables a mayor escala. Para este problema abierto, realizamos una investigación sistemática sobre la invariancia jerárquica, explorando este tema desde perspectivas teóricas, prácticas y de aplicación. A nivel teórico, mostramos cómo construir invariantes sobre-completos con una arquitectura jerárquica tipo Redes Neuronales Convolucionales (CNN), pero de manera completamente interpretable. Se proporcionan el esquema general, definiciones específicas, propiedades invariantes e implementaciones numéricas. A nivel práctico, discutimos cómo personalizar este marco teórico para una tarea específica. Con la sobre-completitud, características discriminativas en relación con la tarea pueden formarse de manera adaptativa en un estilo similar a la Búsqueda de Arquitectura Neuronal (NAS). Demostramos los argumentos anteriores con resultados de precisión, invariancia y eficiencia en experimentos de clasificación de texturas, dígitos y parásitos. Además, a nivel de aplicación, nuestras representaciones se exploran en tareas forenses del mundo real sobre perturbaciones adversas y Contenido Generado por Inteligencia Artificial (AIGC). Tales aplicaciones revelan que la estrategia propuesta no solo realiza la invariancia prometida teóricamente, sino que también exhibe una discriminabilidad competitiva incluso en la era del aprendizaje profundo. Para tareas de visión robusta e interpretable a escalas más grandes, la representación invariante jerárquica puede considerarse como una alternativa efectiva a las CNN tradicionales y a los invariantes.
Qi et al. (Vie,) estudiaron esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: