Key points are not available for this paper at this time.
Nous décrivons le jeu de données vidéo d'action humaine Kinetics de DeepMind. Le jeu de données contient 400 classes d'actions humaines, avec au moins 400 clips vidéo pour chaque action. Chaque clip dure environ 10 secondes et est extrait d'une vidéo différente sur YouTube. Les actions sont axées sur l'humain et couvrent un large éventail de classes, y compris les interactions humain-objet telles que jouer d'instruments, ainsi que les interactions humain-humain telles que serrer la main. Nous décrivons les statistiques du jeu de données, comment il a été collecté, et fournissons quelques chiffres de performance de référence pour les architectures de réseaux neuronaux entraînées et testées pour la classification des actions humaines sur ce jeu de données. Nous réalisons également une analyse préliminaire pour déterminer si le déséquilibre dans le jeu de données entraîne un biais dans les classificateurs.
Zisserman et al. (ven,) ont étudié cette question.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: