Détection et classification des notes d'une piste audio musicale

Vignaud, Quentin (2020). « Détection et classification des notes d'une piste audio musicale » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (2MB)

Résumé

Nous présentons dans ce mémoire des contributions aux domaines du MIR, Musical Information Retrieval, et à l’AMT, Automatic Music Transcription. Une échelle de classification des travaux d’AMT est proposée, afin de définir quels sont les champs d’application de chaque recherche. Cette échelle classe en fonction des contextes monophonique et polyphonique, ainsi que mono-instrumental et multi-instrumental. Un outil est proposé, nommé Mélodium, permettant d’appliquer des traitements de signal à des données audio et musicales. Il gère également les données MIDI, Musical Instrument Digital Interface, ainsi que les fontes sonores. Cet outil est couplé à un langage de script permettant d’automatiser les traitements et de faciliter l’écriture d’expérimentations. Ce langage est axé sur l’application de traitements et la transmission des données entre-eux, en ôtant à l’utilisateur la responsabilité de manipulation de mémoire et d’ordonnancement. En plus de diverses expérimentations réalisées avec Mélodium, nous présentons des modèles à base d’auto-encodeurs éparses et de réseaux de neurones à propagation avant, capables de retranscrire de la musique dans des contextes monophoniques et polyphoniques. Ces modèles exploitent notamment les descripteurs HPCP, Harmonic Pitch Class Profiles, MFCC, Mel Frequency Cepstral Coefficients, et GFCC, Gammatone Frequency Cepstral Coefficients, pour effectuer la transcription. Sur la base de ces expérimentations, nous proposons une méthode permettant d’étendre à tout instrument la transcription monophonique automatique, en détaillant les étapes et l’architecture nécessaire pour y parvenir. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : MIR, AMT, monophonique, polyphonique, MIDI, fonte sonore, Mélodium, auto-encodeur, HPCP, MFCC, GFCC, signal

Type: Mémoire accepté
Informations complémentaires: Fichier numérique reçu dans le cadre du dépôt numérique et enrichi en format PDF / A.
Directeur de thèse: Bouguessa, Mohamed
Mots-clés ou Sujets: Transcription automatique de la musique / Systèmes d'information / Notation musicale / Apprentissage automatique / MIDI
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 23 mars 2021 10:02
Dernière modification: 23 mars 2021 10:02
Adresse URL : http://archipel.uqam.ca/id/eprint/14070

Statistiques

Voir les statistiques sur cinq ans...