Extraction et compréhension de texte dans les films

Testeau, Sébastien (2022). « Extraction et compréhension de texte dans les films » Mémoire. Montréal (Québec), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (9MB)

Résumé

Ce mémoire s’intéresse à la compréhension de texte dans les films et plus généralement à la détection et à la reconnaissance de texte dans les scènes naturelles. Il explore les modèles de langage pour la correction du texte reconnu et s’intéresse aussi à l’indexation et la recherche de contenus dans ce texte. L’idée est de pouvoir reconnaître le texte dans de grandes collections de films et de pouvoir ainsi faire des recherches de contenus particuliers. Nous proposons pour cela une méthode performante d’extraction d’images dans les fichiers vidéo en suggérant un modèle pour la détection de texte, un modèle de reconnaissance de texte, une suite d’outils pour colliger et corriger le texte reconnu et finalement l’indexation et la recherche de ce texte dans un moteur de recherche. Outre l’innovation d’unifier les modèles pour la compréhension de texte dans les films, ce mémoire contribue aussi à améliorer l’accessibilité des oeuvres de l’Office national du film du Canada (ONF) et la découvrabilité du patrimoine cinématographique Canadien. Ce mémoire se base sur la création et l’annotation d’un jeu de données ONF-Text pour identifier les modèles les plus performants pour l’ONF pour la détection, la reconnaissance et la recherche de texte dans les films. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : détection de texte, reconnaissance de texte, segmentation de texte, apprentissage profond, apprentissage automatique, traitement automatique du langage naturel, vision par ordinateur

Type: Mémoire accepté
Informations complémentaires: Fichier numérique reçu et enrichi en format PDF/A.
Directeur de thèse: Meurs, Marie-Jean
Mots-clés ou Sujets: Détection de textes dans les images / Reconnaissance de textes dans les images / Recherche de l'information électronique / Sous-titrage / Documents audiovisuels / Apprentissage automatique / Intelligence artificielle
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 23 août 2023 15:37
Dernière modification: 23 août 2023 15:37
Adresse URL : http://archipel.uqam.ca/id/eprint/16902

Statistiques

Voir les statistiques sur cinq ans...