La détection de petits objets dans les images de drones reste un défi en raison des variations extrêmes d'échelle des objets, des scènes denses et des informations limitées en pixels. Bien que les variantes récentes de YOLOv8 offrent plusieurs échelles de modèles et options architecturales, des recommandations systématiques sur leur utilisation pratique dans la détection par UAV restent limitées. Plutôt que de proposer de nouvelles architectures réseau, cette étude fournit une analyse quantitative coûts-bénéfices et des directives empiriques de déploiement en évaluant de manière exhaustive la famille complète YOLOv8 sur le jeu de données VisDrone afin d'évaluer les effets de la capacité du modèle, de la résolution d'entrée et des modifications architecturales sur la performance de détection de petits objets. Les résultats ont montré qu'une augmentation de la capacité du modèle présentait des rendements décroissants : YOLOv8l a obtenu la meilleure précision globale (15,9 % mAP50), tandis que le modèle plus grand YOLOv8x a montré une dégradation substantielle des performances (7,32 % mAP50) due à une instabilité d'entraînement dans des conditions à données limitées. L'augmentation de la résolution d'entrée de 640 à 1280 a permis une amélioration de 25 % de la performance de détection, dépassant largement les gains obtenus par des modifications architecturales, telles que l'ajout d'une couche de détection P2 (+6 %). La configuration optimale (YOLOv8l @ 1280) a réalisé une amélioration de 488 % par rapport à la référence YOLOv5. Ces résultats démontrent que, pour la détection de petits objets par UAV, prioriser une capacité de modèle et une résolution d'entrée appropriées est plus efficace que d'augmenter la complexité architecturale.
Liu et al. (Mon,) ont étudié cette question.