Simon Leglaive

Séparation de sources audio en milieu réverbérant :
Factorisation en matrices non-négatives et représentation temporelle du mélange convolutif

Nous présentons sur cette page des résultats de séparation de sources avec la méthode [1]. Nous comparons l'approche proposée avec deux autres méthodes de la littérature: [2] et [3, 4].

Toutes les expériences sont réalisées à partir d'une initialisation aveugle des paramètres de source et avec les filtres de mélanges connus et fixés.

Les méthodes sont comparées sur un mélange stéréo avec un temps de réverberation de 256 ms. L'extrait de musique provient du morceau "Ana" par Vieux Farka Toure. Les signaux sources sont disponibles depuis la base de données MASS du MTG.

Les sources images stéréo ont été créées à partir de réponses impulsionnelles de salle simulées grâce à la boîte à outils Roomsimove.

Le code Matlab pour la méthode proposée [1] est disponible ici.

[1] S. Leglaive, R. Badeau, G. Richard. "Séparation de sources audio en milieu réverbérant : Factorisation en matrices non-négatives et représentation temporelle du mélange convolutif", soumis pour publication au XXVIème colloque Gretsi, Juan-les-Pins, 2017.
[2] M. Kowalski, E. Vincent, R. Gribonval. "Beyond the narrowband approximation: Wideband convex methods for under-determined reverberant audio source separation", in IEEE Transactions on Audio, Speech and Language Processing, vol. 18, no. 7, pp. 1818-1829, 2010.
[3] A. Ozerov, C. Févotte. "Multichannel nonnegative matrix factorization in convolutive mixtures for audio source separation", in IEEE Transactions on Audio, Speech and Language Processing, vol. 18, no. 3, pp. 550-563, 2010.
[4] A. Ozerov, C. Févotte, R. Blouet, J.-L. Durrieu. "Multichannel nonnegative tensor factorization with structured constraints for user-guided audio source separation", in Proc. of IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Prague, République tchèque, 2011, pp. 257-260.

Mélange stéréo:

	Sources originales (mono)	Méthode proposée [1]	Kowalski et al. [2]	Ozerov et Févotte [3, 4]
Drums
Voice
Guitar 1
Guitar 2
Bass