CentraleSupélec
Soit \(x(t) \in \mathbb{R}\) un signal déterministe défini sur \(t \in \mathbb{Z}\) de module sommable, c’est-à-dire tel que
\[\sum\limits_{t \in \mathbb{Z}} |x(t)| < \infty.\]
La TFTD de \(x(t)\) est définie par
\[ \hat{x}(\nu) = \sum\limits_{t \in \mathbb{Z}} x(t) e^{-\imath 2 \pi \nu t}, \]
où \(\nu\) est appelée la fréquence réduite (ou normalisée) et \(\imath = \sqrt{-1}\).
Par définition, la TFTD est périodique de période 1 :
\[\hat{x}(\nu + 1) = \sum\limits_{t \in \mathbb{Z}} x(t) e^{-\imath 2 \pi (\nu +1) t} = \sum\limits_{t \in \mathbb{Z}} x(t) e^{-\imath 2 \pi \nu t} e^{-\imath 2 \pi t} = \sum\limits_{t \in \mathbb{Z}} x(t) e^{-\imath 2 \pi \nu t} = \hat{x}(\nu). \]
On limite donc sa représentation à l’intervalle \(\nu \in [-0.5, 0.5[\) ou \(\nu \in [0, 1[\).
La TFTD inverse est définie par :
\[ x(t) = \int_{-1/2}^{1/2} \hat{x}(\nu) e^{+\imath 2 \pi \nu t} d\nu.\]
| Propriété | Domaine temporel | Domaine spectral |
|---|---|---|
| Linéarité | \(a x(t) + b y(t)\) | \(a\hat{x}(\nu) + b\hat{y}(\nu)\) |
| Décalage temporel | \(x(t-t_0)\) | \(\hat{x}(\nu) e^{-\imath 2 \pi \nu t_0}\) |
| Décalage fréquentiel | \(x(t) e^{\imath 2 \pi \nu_0 t}\) | \(\hat{x}(\nu-\nu_0)\) |
| Convolution | \([x \star y](t) = \sum_{k \in \mathbb{Z}} x(k) y(t-k)\) | \(\hat{x}(\nu) \hat{y}(\nu)\) |
| Symétrie hermitienne | \(x(t) \in \mathbb{R}\) | \(\hat{x}(\nu) = \hat{x}^*(1-\nu)\) |
La TFTD d’un signal aléatoire n’est en général pas définie.
Exemple :
On va donc plutôt chercher à travailler avec des quantités moyennes (i.e., en espérance) pour étudier les propriétés spectrales d’un processus aléatoire.
Soit \(\{X(t)\}_{t}\) un processus aléatoire stationnaire au sens large (SSL) de moyenne \(m_X\) et fonction d’autocovariance \(R_{XX}(k)\) absolument sommable.
Le théorème de Wiener-Khinchin énonce que la densité spectrale de puissance (DSP) du processus est égale à la TFTD de sa fonction d’autocovariance : \[ S_{XX}(\nu) = \sum\limits_{k \in \mathbb{Z}} R_{XX}(k) e^{-\imath 2 \pi \nu k}, \qquad \nu \in \left[-0.5, 0.5\right]. \]
La fonction d’autocovariance est donc donnée par le TFTD inverse de la DSP : \[ R_{XX}(k) = \int_{-1/2}^{1/2} S_{XX}(\nu) e^{+\imath 2 \pi \nu k} d\nu.\]
On peut montrer que \(S_{XX}(\nu) \ge 0\) pour tout \(\nu\) (voir exercice de TD).
La DSP telle qu’introduite dans le slide précédent n’est définie que si la fonction d’autocovariance est absolument sommable, mais si ce n’est pas le cas ?
Il existe une notion plus générale pour caractériser la distribution de la puissance d’un signal aléatoire en fréquence, appelée mesure spectrale de puissance
C’est assez technique, car cela fait appel à la théorie de la mesure que nous n’avons pas étudiée (voir par exemple le polycopié de J.-C. Breton sur l’intégrale de Lebsegue).
Nous allons donc essayer de voir tout cela assez simplement.
Pour un traitement plus rigoureux, voir par exemple
Le point de départ concerne les « bonnes propriétés » de la fonction d’autocovariance d’un processus SSL.
Comme vu dans les cours précédents, celle-ci est à symétrie hermitienne et semi-définie positive.
Le théorème d’Herglotz (qu’on admet) nous dit alors qu’il existe une unique représentation spectrale de la fonction d’autocovariance.
Cette représentation spectrale prend la forme d’une mesure positive \(\mu \ge 0\) définie sur \(\nu \in [-0.5, 0.5[\), appelée mesure spectrale de puissance et telle que : \[ R_{XX}(k) = \int_{-0.5}^{0.5} e^{+\imath 2 \pi \nu k} d\mu(\nu). \]
Cette mesure existe toujours, elle peut être continue ou discrète, et elle encode la distribution de la puissance du processus en fonction de la fréquence.
La mesure spectrale \(\mu\) permet de quantifier la puissance contenue dans une bande de fréquences \([\nu_1, \nu_2]\) donnée : \[ \mu([\nu_1, \nu_2] ) = \int_{\nu_1}^{\nu_2} d\mu(\nu). \]
Cette expression représente l’intégrale de la fonction constante \(1\) par rapport à la mesure \(\mu\) sur l’intervalle considéré.
Certains signaux aléatoires contiennent des composantes périodiques ou constantes.
Leur puissance n’est pas répartie sur tout le spectre, mais concentrée à certaines fréquences : la mesure spectrale est discrète.
On parle alors de raies spectrales : des pics de puissance dans le domaine fréquentiel.
On va utiliser la mesure de Dirac pour représenter une concentration infiniment fine de puissance à une certaine fréquence.
Soit \(\delta_{x_0}\) la mesure de Dirac définie sur un espace mesurable \((E, \mathcal{A})\) (par exemple \(\mathbb{R}\) muni de la tribu borélienne) et centrée en \(x_0 \in E\). Pour tout ensemble mesurable \(A \in \mathcal{A}\), on a :
\[ \delta_{x_0}(A) = \int_{A} d\delta_{x_0} = \begin{cases} 1 \text{ si } x_0 \in A \\ 0 \text{ si } x_0 \notin A \\ \end{cases} \]
Autrement dit, l’intégrale de la fonction constante \(1\) sur \(A\) par rapport à la mesure \(\delta_{x_0}\) donne simplement l’indication de la présence ou non du point \(x_0\) dans \(A\).
Donc en particulier, si \(A = \mathbb{R}\), on a \(\displaystyle\int_{\mathbb{R}} d\delta_{x_0} = 1\).
Et pour toute fonction mesurable \(f : E \rightarrow \mathbb{R}\), on a : \(\displaystyle\int_{E} f(y) d\delta_{x_0}(y) = f(x_0)\).
La mesure de Dirac permet de « sélectionner » la valeur d’une fonction au point où la mesure est centrée.
On utilise la mesure de Dirac \(\delta_{\nu_0}(\nu)\) pour représenter une concentration infiniment fine de puissance à la fréquence \(\nu_0\).
Par exemple, pour \(X(t) = A \cos(2\pi \nu_0 t + \phi)\) avec \(\nu_0 \in [0, 0.5[\) et \(\phi \sim U([0, 2\pi])\), la mesure spectrale est donnée par (voir exercice TD) : \[\mu(\nu) = \frac{A^2}{4} \left[ \delta_{\nu_0}(\nu) + \delta_{-\nu_0}(\nu)\right].\]
On en déduit la puissance totale du signal dans la bande de fréquence \([-0.5, 0.5[\) :
\[ \begin{aligned} \mu([-0.5, 0.5[ ) &= \int_{-0.5}^{0.5} d\mu(\nu) = \frac{A^2}{4} \int_{-0.5}^{0.5} d\delta_{\nu_0}(\nu) + \frac{A^2}{4} \int_{-0.5}^{0.5} d\delta_{-\nu_0}(\nu) = \frac{A^2}{2}. \end{aligned} \]
La densité spectrale de puissance correspond au cas particulier où la mesure spectrale \(\mu\) est absolument continue par rapport à la mesure de Lebesgue \(d\nu\), i.e. \[ d\mu(\nu) = S_{XX}(\nu) d\nu. \]
On pourra alors utiliser la DSP pour quantifier la puissance (en moyenne statistique) du signal dans une bande de fréquence :
\[ \mu([\nu_1, \nu_2] ) = \int_{\nu_1}^{\nu_2} d\mu(\nu) = \int_{\nu_1}^{\nu_2} S_{XX}(\nu) d\nu. \]
En résumé : Le théorème d’Herglotz garantit que toute fonction d’autocovariance semi-définie positive admet une représentation spectrale sous forme de mesure, même si elle n’est pas absolument sommable. Quand elle est sommable, la DSP existe et on aboutit alors au théorème de Wiener-Khinchin.
| Type de signal | Mesure spectrale | Exemple | Représentation fréquentielle |
|---|---|---|---|
| Périodique ou constant | Discrète (masses de Dirac) | Cosinus avec phase aléatoire | Raies spectrales (pics isolés) |
| Aléatoire non périodique | Continue (densité spectrale) | Bruit blanc | Spectre lisse (continu) |
La mesure spectrale peut combiner une partie discrète (raies) et une partie continue. (voir exercice TD)
Essayons de comprendre la DSP d’une autre façon, complémentaire à la précédente.
Puisque la TFTD d’un processus SSL \(\{X(t)\}_{t \in \mathbb{Z}}\) n’est pas définie, on va tronquer la somme à un intervalle de temps \([-T, T]\), \(T \ge 1\), et on fera tendre \(T\) vers l’infini.
On définit donc \(\hat{S}_T(\nu)\) comme le spectre de puissance du processus observé sur l’intervalle de temps \([-T, T]\), et normalisé par \(2T+1\) :
\[ \hat{S}_T(\nu) = \frac{1}{2T+1} \left\vert \sum_{t=-T}^T X(t) e^{-\imath 2 \pi \nu t} \right\vert^2 \ge 0. \]
On moyenne statistiquement cette quantité, en prenant son espérance (voir exercice TD) :
\[ \begin{aligned} \mathbb{E}[\hat{S}_T(\nu)] &= \frac{1}{2T+1} \sum_{t=-T}^T \sum_{k=-T}^T R_{XX}(t-k) e^{-\imath 2 \pi \nu (t-k)}\\ &= \sum_{p \in \mathbb{Z}} R_{XX}(p) e^{-\imath 2 \pi \nu p} \left(1 - \frac{|p|}{2T+1}\right) \mathbb{1}\{|p|\le 2T\}, \end{aligned} \] avec \(\mathbb{1}\{\cdot\}\) la fonction indicatrice.
On obtient finalement grâce au théorème de convergence dominée :
\[ \underset{T \rightarrow +\infty}{\lim} \mathbb{E}[\hat{S}_T(\nu)] = S_{XX}(\nu).\]
Et on en déduit que la DSP est toujours positive.
On peut donc comprendre la DSP comme la moyenne statistique du spectre de puissance (normalisé) d’un processus SSL observé sur un intervalle de temps \([-T, T]\)
avec \(T\) qui tend vers l’infini.
Pour deux processus SSL \(\{X(t)\}_{t\in \mathbb{Z}}\) et \(\{Y(t)\}_{t\in \mathbb{Z}}\) possédant une DSP, on définit la densité inter-spectrale de puissance par :
\[ S_{XY}(\nu) = \sum\limits_{k \in \mathbb{Z}} R_{XY}(k) e^{-\imath 2 \pi \nu k}, \]
où \(R_{XY}(k) = \mathbb{E}[X(t+k)Y^*(t)]\) est la fonction d’intercovariance.
Contrairement à la DSP (toujours réelle et positive), la densité inter-spectrale peut avoir une partie imaginaire non nulle.
Une conséquence fondamentale de la stationnarité (au sens large) est que les coefficients de TFTD du signal tronqué sont asymptotiquement décorrélés pour des fréquences distinctes.
Montrons ce résultat :
Soit \(\{X(t)\}_{t\in \mathbb{Z}}\) un processus SSL supposé centré.
On définit les coefficients de la TFTD du signal tronqué sur \([-T, T]\) : \[ \hat{X}_T(\nu) = \sum_{t=-T}^{T} X(t) e^{-\imath 2\pi \nu t}. \]
On s’intéresse à la covariance entre deux coefficients à des fréquences \(\nu_1\) et \(\nu_2\) : \[ \begin{aligned} \mathbb{E}[\hat{X}_T(\nu_1) \hat{X}_T^*(\nu_2)] &= \sum_{t=-T}^{T} \sum_{s=-T}^{T} \mathbb{E}[X(t)X(s)^*] e^{-\imath 2\pi \nu_1 t} e^{\imath 2 \pi \nu_2 s} \\ &= \sum_{t=-T}^{T} \sum_{k=-2T}^{2T} R_{XX}(k) e^{-\imath 2\pi \nu_1 t} e^{\imath 2\pi \nu_2 (t-k)} \qquad (\small{k = t - s \in [-2T, 2T]}) \\ &= D_T(\Delta\nu) \sum_{k=-2T}^{2T} R_{XX}(k) e^{-\imath 2\pi \nu_2 k} \end{aligned} \]
où
Le noyau de Dirichlet, aussi appelé fonction sinus cardinal périodique, peut se développer de la façon suivante : \[ D_T(\Delta\nu) = \sum\limits_{t=-T}^{T} e^{-\imath 2\pi \Delta\nu t} = \begin{cases} \displaystyle \frac{\sin( \pi (2T + 1) \Delta\nu)}{\sin( \pi \Delta\nu)} & \text{si } \Delta\nu \notin \mathbb{Z} \\ 2T + 1 & \text{si } \Delta\nu \in \mathbb{Z}. \end{cases}\]
Source: Wikipedia. \(L=0.5\) et \(n=T\).
Etudions finalement la limite quand \(T \rightarrow +\infty\) de \[\mathbb{E}[\hat{X}_T(\nu_1) \hat{X}_T^*(\nu_2)] = D_T(\Delta\nu) \sum\limits_{k=-2T}^{2T} R_{XX}(k) e^{-\imath 2\pi \nu_2 k}. \]
Lorsque \(T \to \infty\) :
Si \(\nu_1 \ne \nu_2\), alors \(\Delta\nu \ne 0\) et le noyau de Dirichlet tend vers 0.1
\[ \underset{T \rightarrow + \infty}{\lim} \mathbb{E}[\hat{X}_T(\nu_1) \hat{X}_T^*(\nu_2)] = 0. \]
Les coefficients de la TFTD tronquée sont donc asymptotiquement décorrélés pour des fréquences distinctes.
Si \(\nu_1 = \nu_2 = \nu\), alors \(\Delta\nu = 0\) et \(D_T(0) = 2T + 1\) :
\[\mathbb{E}[\hat{X}_T(\nu_1) \hat{X}_T^*(\nu_2)] = \mathbb{E}[|\hat{X}_T(\nu)|^2] = (2T + 1) \sum\limits_{k=-2T}^{2T} R_{XX}(k) e^{-\imath 2\pi \nu k} \]
En divisant par \(2T + 1\) et en passant à la limite on obtient :
\[ \underset{T \rightarrow + \infty}{\lim} \frac{1}{2T + 1} \mathbb{E}[|\hat{X}_T(\nu)|^2] = \sum\limits_{k \in \mathbb{Z}} R_{XX}(k) e^{-\imath 2 \pi \nu k} = S_{XX}(\nu). \]
La variance (normalisée) des coefficients de la TFTD tronquée est asymptotiquement égale à la DSP.
Ce résultat est à la base d’un très grand nombres de modèles et algorithmes en traitement du signal, notamment audio.


Liutkus, A., Badeau, R., & Richard, G. (2011). Gaussian processes for underdetermined source separation. IEEE Transactions on Signal Processing, 59(7), 3155-3167.
Lay, B., Makarov, R., & Gerkmann, T. (2025). Diffusion Buffer: Online Diffusion-based Speech Enhancement with Sub-Second Latency. Interspeech.
On peut interpréter le noyau de Dirichlet comme une approximation de la mesure de Dirac : il concentre de plus en plus d’énergie autour de 0 quand \(T\) augmente, tout en conservant une aire constante égale à 1.
Pour toute fonction mesurable \(\phi : [-0.5, 0.5] \to \mathbb{R}\), on a : \[ \lim_{T \to \infty} \int_{-0.5}^{0.5} \phi(\nu) D_T(\nu - \nu_0) \, d\nu = \phi(\nu_0) \]
Cette convergence est dite faible au sens de la théorie de la mesure.
La TFTD de l’exponentielle complexe \(X(t) = e^{-\imath 2 \pi \nu_0 t}\) ne converge pas au sens classique, car \(X(t)\) n’est pas sommable.
En revanche, la TFTD de ce signal définit une mesure spectrale égale à la mesure de Dirac \(\delta_{\nu_0}(\nu)\)
En effet :
\[ \text{TFTD}[e^{-\imath 2 \pi \nu_0 t}](\nu) = \sum\limits_{t \in \mathbb{Z}} e^{-\imath 2 \pi (\nu - \nu_0) t} = \lim_{T \to \infty} D_{T}(\nu - \nu_0) \, « = » \, \delta_{\nu_0}(\nu). \]
« = » signifie ici que la convergence se fait au sens des mesures : \[ \lim_{T \to \infty} \int_{-0.5}^{0.5} \phi(\nu) S_{T}(\nu - \nu_0) d\nu = \int_{-0.5}^{0.5} \phi(\nu) d\delta_{\nu_0}(\nu) = \phi(\nu_0). \]
La somme infinie agit comme une mesure ponctuelle qui sélectionne la valeur de \(\phi\) en \(\nu_0\)