Céline JACQUES soutient sa thèse de doctorat réalisée au sein de l'équipe Analyse et synthèse des sons (STMS - CNRS/Ircam/Sorbonne Université), intitulée :
"Méthodes d’apprentissage automatique pour la transcription automatique de la batterie"
le jury est composé de :
M Sylvain Marchand - Rapporteur
M Gaël Richard - Rapporteur
M Carlos Agon - Examinateur
M Bertrand David - Examinateur
Mme Jimena Royo-Letelier- Examinatrice
M Emmanuel Vincent - Examinateur
M Axel Röbel -Directeur
Résumé :
Cette thèse soulève deux principales problématiques : l’adaptation des méthodes de décomposition non négative au signal analysé et l’utilisation de l’apprentissage profond pour la transcription automatique de la batterie.
La prise en compte des informations du signal analysé dans le modèle peut être réalisée par leur introduction durant les étapes de décomposition. Une première approche est de reformuler l’étape de décomposition dans un contexte probabiliste pour faciliter l’introduction d’informations a priori avec des méthodes comme la SI-PLCA et la NMD statistique. Une deuxième approche est d’implémenter directement dans la NMD une stratégie d’adaptation en modifiant le dictionnaire des motifs pré-appris tout en appliquant de fortes contraintes pour conserver leurs significations physiques.
La deuxième partie de cette thèse porte sur la sélection des segments de signaux à analyser. Il est préférable d’analyser les segments où au moins un événement percussif a lieu. Un détecteur d’onsets basé sur un réseau de neurones convolutif (CNN) est adapté pour détecter uniquement les onsets percussifs. Les résultats obtenus étant très intéressants, le détecteur est entraîné à ne détecter qu’un seul instrument permettant la réalisation de la transcription des trois principaux instruments de batterie avec trois CNN. Finalement, l’utilisation d’un CNN multi-sorties est étudiée pour transcrire la partie de batterie avec un seul réseau.