Key points are not available for this paper at this time.
Les backbones de réseaux de neurones efficaces pour dispositifs mobiles sont souvent optimisés pour des métriques telles que les FLOPs ou le nombre de paramètres. Cependant, ces métriques peuvent ne pas bien corréler avec la latence du réseau une fois déployé sur un dispositif mobile. Par conséquent, nous effectuons une analyse approfondie de différentes métriques en déployant plusieurs réseaux adaptés aux mobiles sur un dispositif mobile. Nous identifions et analysons les goulets d'étranglement architecturaux et d'optimisation dans les récentes architectures efficaces de réseaux de neurones et proposons des moyens de les atténuer. À cette fin, nous concevons un backbone efficace appelé MobileOne, avec des variantes atteignant un temps d'inférence inférieur à 1 ms sur un iPhone12 avec une précision top-1 de 75,9 % sur ImageNet. Nous montrons que MobileOne obtient des performances à la pointe de la technologie au sein des architectures efficaces tout en étant de nombreuses fois plus rapide sur mobile. Notre meilleur modèle obtient des performances similaires sur ImageNet à celles de MobileFormer tout en étant 38× plus rapide. Notre modèle obtient une précision top-1 de 2,3 % supérieure sur ImageNet par rapport à EfficientNet avec une latence similaire. De plus, nous montrons que notre modèle se généralise à plusieurs tâches - classification d'images, détection d'objets et segmentation sémantique avec des améliorations significatives en termes de latence et de précision par rapport aux architectures efficaces existantes lorsqu'il est déployé sur un dispositif mobile. Le code et les modèles sont disponibles sur https://github.com/apple/ml-mobileone
Vasu et al. (Jeudi,) ont étudié cette question.