Accueil Enseignement Recherche Introduction Quantification Codage audio Séparation
de sources Identification
de systèmes Qualité audio Tatouage audio Signaux
biophysiques Projets HDR

La séparation de sources consiste, à partir de plusieurs mélanges de plusieurs signaux, à estimer les signaux sources. Nous avons considéré deux situations, la séparation de sources informée et la séparation aveugle de sources, dans le cas de signaux audio.

Séparation de sources informée

Dans le cas où les sources originelles sont disponibles au début de la chaîne de traitement (mixage d’un morceau de musique par exemple), la “séparation de sources informée” (ISS) repose sur l’insertion, dans le mélange, d’un tatouage décrivant succinctement les sources et le mélange. L’extraction de cette information par le récepteur du mélange facilite alors la séparation.

Nous avons proposé des méthodes alternative de « dopage », consistant à modifier de manière imperceptible l’histogramme de la représentation temporelle ou temps-fréquence des sources. Considérant des distributions gaussiennes généralisées, il s’agit de réduire itérativement leur facteur de forme sous contrainte d’inaudibilité de la transformation (dans le cas de la représentation temporelle) ou des distorsions spectrales introduites (dans le cas de la représentation temps-fréquence). A partir du mélange dopé, les sources sont séparées par des techniques classiques d’analyse en composantes indépendantes (ICA) ou d’analyse en composantes parcimonieuses (SCA). [1,2,4]

L’implémentation du codage spatial d’objets audio (Spatial Audio Object Coding, SAOC) dans la norme MPEG-H a réduit l’intérêt pratique de l’ISS dans ce cadre applicatif, de sorte que nous étudions son application à d’autres contextes, y compris non-audio.

Séparation aveugle de sources

À partir de l’idée qu’une source seule est plus nette que mélangée à d’autres, nous avons proposé de piloter une séparation par la maximisation de la Non-Intrusive Audio Clarity (NIAC), sous l’hypothèse que celle-ci mesure bien la netteté. Dans le cas d’un mélange linéaire instantané déterminé, la séparation de sources fondée sur la NIAC a des performances comparables à celles de l’ICA ; en outre elle converge rapidement et s’avère robuste à l’initialisation de l’algorithme, à la gaussiannité des sources, à leur dépendance et au conditionnement de la matrice de mélange [3,5].

Nous étudions actuellement la séparation de mélanges convolutifs et de mélanges sous-déterminés

Publications

G. Mahé, E.Z. Nadalin and J.M.T. Romano, "Doping Audio Signals for Source Separation", Proc. Eusipco 2012, august 2012, Bucarest, Romania, pp. 2402-2406

G. Mahé, E.Z. Nadalin, R. Suyama and J.M.T. Romano, "Perceptually controlled doping for audio source separation", EURASIP Journal on Advances in Signal Processing, 2014(1):27, march 2014.

Gaël Mahé, Lionel Moisan, Mihai Mitrea. "An Image-Inspired Audio Sharpness Index", 25th European Signal Processing Conference (EUSIPCO), Kos island, Greece, Aug 2017.

Gaël Mahé, Mériem Jaidane, "Perceptually Controlled Reshaping of Sound Histograms" IEEE/ACM Transactions on Audio, Speech and Language Processing, 2018, 26 (9), pp.1671-1683.

Gaël Mahé, Giulio G R Suzumura, Lionel Moisan, Ricardo Suyama. "A Non Intrusive Audio Clarity Index (NIAC) and its Application to Blind Source Separation" , Signal Processing, Vol. 194, 2022.