informations

Type
Séminaire / Conférence
Lieu de représentation
Ircam, Salle Igor-Stravinsky (Paris)
durée
01 h 37 min
date
1 décembre 2017

Au-delà des performances brutes remarquables obtenues par les réseaux de neurones profonds dans des tâches de classification supervisée en audio, l’analyse des représentations qu’ils produisent peut être utile pour des post-traitements ou pour faire de la catégorisation. Par exemple, de nombreuses méthodes ont récemment été proposées pour retrouver des éléments saillants dans les entrées données au modèle. Cela peut permettre de localiser en temps (et en fréquence) les occurrences d’évènements que l’on cherche à détecter.
Dans cette présentation, des résultats en parole, détection de chant d’oiseaux et classification en genres musicaux viendront illustrer ces préoccupations.
biographie :

Depuis septembre 2013, Thomas Pellegrini est maître de conférences en informatique à l'Université de Toulouse III - Paul Sabatier et chercheur de l'équipe SAMoVA de l'Institut de Recherche en Informatique de Toulouse. Diplômé du DEA en acoustique, traitement du signal, informatique, appliqués à la musique (ATIAM) et ingénieur de l'Ecole Supérieure de Physique et Chimie Industrielle de Paris (ESPCI), il a réalisé une thèse sur la transcription automatique de langues peu dotées, encadré par Lori Lamel, LIMSI-CNRS. Puis, de 2008 à 2013, il a été chercheur postdoctoral au laboratoire Spoken Language Systems de l’institut INESC-ID à Lisbonne, au Portugal. Ses recherches portent sur l’analyse et la modélisation de contenus audio, en particulier appliqués au traitement de la parole (transcription automatique, évaluation de la prononciation). Récemment, il s’intéresse aux réseaux de neurones profonds et à l’apprentissage de représentations pour des applications en parole, musique et bruits environnementaux (https://www.irit.fr/~Thomas.Pellegrini/). Il est membre de l’ISCA et membre du bureau de l’AFCP.


Thomas PELLEGRINI : Exploration de DNN pour des tâches d’analyse audio

résumé:

Au-delà des performances brutes remarquables obtenues par les réseaux de neurones profonds dans des tâches de classification supervisée en audio, l’analyse des représentations qu’ils produisent peut être utile pour des post-traitements ou pour faire de la catégorisation. Par exemple, de nombreuses méthodes ont récemment été proposées pour retrouver des éléments saillants dans les entrées données au modèle. Cela peut permettre de localiser en temps (et en fréquence) les occurrences d’évènements que l’on cherche à détecter.
Dans cette présentation, des résultats en parole, détection de chant d’oiseaux et classification en genres musicaux viendront illustrer ces préoccupations.

-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-

biographie :

Depuis septembre 2013, Thomas Pellegrini est maître de conférences en informatique à l'Université de Toulouse III - Paul Sabatier et chercheur de l'équipe SAMoVA de l'Institut de Recherche en Informatique de Toulouse. Diplômé du DEA en acoustique, traitement du signal, informatique, appliqués à la musique (ATIAM) et ingénieur de l'Ecole Supérieure de Physique et Chimie Industrielle de Paris (ESPCI), il a réalisé une thèse sur la transcription automatique de langues peu dotées, encadré par Lori Lamel, LIMSI-CNRS. Puis, de 2008 à 2013, il a été chercheur postdoctoral au laboratoire Spoken Language Systems de l’institut INESC-ID à Lisbonne, au Portugal. Ses recherches portent sur l’analyse et la modélisation de contenus audio, en particulier appliqués au traitement de la parole (transcription automatique, évaluation de la prononciation). Récemment, il s’intéresse aux réseaux de neurones profonds et à l’apprentissage de représentations pour des applications en parole, musique et bruits environnementaux (https://www.irit.fr/~Thomas.Pellegrini/). Il est membre de l’ISCA et membre du bureau de l’AFCP.

intervenants


partager


Vous constatez une erreur ?

IRCAM

1, place Igor-Stravinsky
75004 Paris
+33 1 44 78 48 43

heures d'ouverture

Du lundi au vendredi de 9h30 à 19h
Fermé le samedi et le dimanche

accès en transports

Hôtel de Ville, Rambuteau, Châtelet, Les Halles

Institut de Recherche et de Coordination Acoustique/Musique

Copyright © 2022 Ircam. All rights reserved.