Key points are not available for this paper at this time.
À l'ère moderne, la génération de légendes d'images est devenue l'un des outils les plus largement requis. De plus, il existe des applications intégrées qui génèrent et fournissent une légende pour une certaine image, tout cela est fait grâce à des modèles de réseaux neuronaux profonds. Le processus de génération d'une description d'une image s'appelle la génération de légendes d'images. Cela nécessite de reconnaître les objets importants, leurs attributs et les relations entre les objets dans une image. Cela génère des phrases syntaxiquement et sémantiquement correctes. Dans cet article, nous présentons un modèle d'apprentissage profond pour décrire les images et générer des légendes en utilisant la vision par ordinateur et la traduction automatique. Cet article vise à détecter différents objets trouvés dans une image, à reconnaître les relations entre ces objets et à générer des légendes. Le jeu de données utilisé est Flickr8k et le langage de programmation utilisé était Python3, et une technique d'apprentissage automatique appelée Apprentissage Transféré sera mise en œuvre avec l'aide du modèle de légende, pour démontrer l'expérience proposée. Cet article expliquera également les fonctions et la structure des divers réseaux de neurones impliqués. La génération de légendes d'images est un aspect important de la vision par ordinateur et du traitement du langage naturel. Les générateurs de légendes d'images peuvent trouver des applications dans la segmentation d'images comme utilisé par Facebook et Google Photos, et encore plus, son utilisation peut être étendue aux images vidéo. Ils automatiseront facilement le travail d'une personne qui doit interpréter des images. Sans parler de son immense portée pour aider les personnes malvoyantes.
Pagariya et al. (Mar), ont étudié cette question.