Un modèle de correspondance cross-modal basé sur CLIP pour la récupération d'image-texte | Synapse