Cet article est une réflexion académique sur l'utilisation des outils d'IA Transkribus et AntConc dans le cadre d'un projet de stage de doctorat en sciences humaines numériques à la British Library pour extraire des métadonnées à partir de catalogues imprimés pour le catalogue en ligne. Ce projet se concentre sur le BMC XI, le catalogue des incunables anglais à la British Library publié en 2007. Transkribus est une « plateforme complète pour la numérisation, la reconnaissance de texte alimentée par l'IA, la transcription et la recherche de documents historiques », tandis qu'AntConc est un « ensemble d'outils d'analyse de corpus freeware pour la concordance et l'analyse de texte ». Ensemble, ces outils peuvent être utilisés pour extraire des informations en masse à uploader dans les bases de données spécialisées MEI (Material Evidence Incunabula) et ISTC (Incunabula Short Title Catalogue), ainsi que pour identifier des motifs et des tendances dans les descriptions d'incunables. Ce projet a suivi les principes de FRAIM (Encadrement de l'implémentation et de la gestion responsable de l'IA).
Jeanette Croen (Wed,) a étudié cette question.