Key points are not available for this paper at this time.
La considération croissante des réseaux neuronaux convolutionnels (CNN) n'a pas empêché l'utilisation de la méthode des k-plus proches voisins (kNN). En fait, une approche hybride CNN-kNN est une option intéressante où le réseau se spécialise dans l'extraction de caractéristiques à travers ses activations (codes neuronaux), tandis que le kNN a l'avantage de réaliser une récupération par similarité. Cependant, cette approche hybride présente également les inconvénients de la recherche kNN, en particulier son coût computationnel élevé qui est, en principe, indésirable pour des données à grande échelle. Dans cet article, nous présentons la première étude complète des algorithmes de recherche kNN efficaces utilisant cette approche hybride CNN-kNN. Cela a été réalisé en considérant jusqu'à 16 algorithmes différents, chacun étant évalué avec une paramétrisation différente, sur 7 ensembles de données de composition hétérogène. Nos résultats montrent qu'aucun algorithme unique n'est capable de couvrir tous les aspects, mais que chaque famille d'algorithmes est mieux adaptée à des aspects spécifiques du problème. Cela signifie que les algorithmes de recherche de similarité rapide maintiennent leur performance, mais ne réduisent pas le coût autant que la famille de réduction de données. À son tour, la famille de recherche de similarité approchée est postulée comme une bonne option lorsqu'il s'agit d'équilibrer précision et efficacité. Les expériences suggèrent également que considérer des algorithmes de transformation statistique tels que l'analyse discriminante linéaire pourrait être utile dans certains cas.
Gallego et al. (Wed,) ont étudié cette question.