diff --git a/polycopie.tex b/polycopie.tex index 9b2463c0ee8ced7402c4221a0fd23a113da12d0e..13bb2e7fcda4e4397b8fe74d208d648a8f5fa58c 100644 --- a/polycopie.tex +++ b/polycopie.tex @@ -363,7 +363,7 @@ différentes. Par exemple, si $d=2$ nous avons les trois formes suivantes : \paragraph{Le shift sur un alphabet fini.} Dans les exemples précendants l'espace $X$ était toujours un sous-espace compact -d'un manifold. Cet exemple est très different et il a plusieurs applications en +d'un manifold. Cet exemple est très différent et il a plusieurs applications en théorie des nombres dans les pages suivantes. Soit $X=\{0,1,\ldots,k-1\}^\ZZ$, \textit{i.e.} l'espace des mots double-infinis @@ -882,15 +882,44 @@ l'objet central dans l'étude de la théorie ergodique. $T^{-1}E=E$) est soit $0$ soit $1$. \end{definition} -Il n'est pas difficile de voir que $T$ est ergodique si et seulement -si les fonctions mesurables et invariantes par $T$ (fonctions $f$ -telles que $f=f\circ T$) sont des fonctions constantes presque -partout. +\begin{proposition}\label{prop:equivalent-ergodicity} + Soit $(X,T,\mu)$ un système dynamique + mesuré. Alors les assertions suivantes sont équivalentes : + \begin{enumerate}[(1)] + \item $T$ est ergodique ; + \item toute application $f\colon X\to \RR$ mesurable, telle que + $f\circ T=f$ presque partout, est presque partout constante ; + \item toute application $f\in L^1(X)$, telle que $f\circ T=f$ + presque partout, est presque partout constante ; + \item toute application $f\in L^2(X)$, telle que $f\circ T=f$ + presque partout, est presque partout constante. + \end{enumerate} +\end{proposition} + +\begin{proof} + \begin{itemize} + \item (2) $\Rightarrow$ (3) : Toute $f\in L^1(X)$ est mesurable. + \item (3) $\Rightarrow$ (4) : $L^1(X)\subset L^2(X)$. + \item (4) $\Rightarrow$ (1) : Soit $E\subseteq X$ mesurable tel que + $T^{-1}E=E$ et $1_E$ la fonction caractéristique de $E$. Alors $1_E\in + L^2(X)$ et donc avec (4) $1_E$ est constante presque partout. Donc $1_E$ est + égale à $0$ ou à $1$ presque partout et $\mu(E)=0$ ou $1$. + \item (1) $\Rightarrow$ (2) : Si $f$ n'est pas + constante presque partout, il existe un réel $x$ tel que, en notant + $A'=f^{-1}([x,+\infty])$, on a $0<\mu(A')<1$. L'égalité $f\circ T=f$ + presque partout assure que les ensembles $A'$ et $T^{-1}(A')$ + coïncident en dehors d'une partie négligeable. L'ensemble + $A=\bigcap_{p\in\NN} \bigcup_{n\geq p}T^{-n}(A')$ coïncide alors + avec $A'$ en dehors d'une partie négligeable. En particulier, on a + $0<\mu(A)<1$. comme $T^{-1}(A)=A$, ceci contredit l'ergodicité de $\mu$. + \end{itemize} + +\end{proof} L'ergodicité semble être une propriété plutôt faible. Remarquablement, c'est exactement la propriété qui nous permet de faire des assertions -rigoureuses de la forme ``les moyennes temporelles tendent vers les -moyennes de l'espace''. +rigoureuses de la forme ``les moyennes temporelles tendent vers la +moyenne spatiale''. Avant de continuer, nous voulons donner quelques exemples. @@ -901,17 +930,13 @@ Avant de continuer, nous voulons donner quelques exemples. \end{proposition} \begin{proof} - Soit $f\colon \TT \to \RR$ une fonction mesurable et invariante par - $R_\alpha$ qui n'est pas constante presque partout. Chaque niveau - $\{x\colon s\leq f(x)\leq t\}$ est aussi invariante par $R_\alpha$ : - en passant par un ensemble de niveau où la fonction n'est pas - constante presque partout nous pouvons supposer que $f\in - L^1(\TT)$. Soit $\varepsilon >0$. Comme l'espace des fonctions - continues $C(\TT)$ est dense dans $L^1(\TT)$, il existe une fonction + Nous utilisons la version (3) du proposition \ref{prop:equivalent-ergodicity}. + Soit $\varepsilon >0$. Comme l'espace des fonctions + continues $\mathcal{C}(\TT)$ est dense dans $L^1(\TT)$, il existe une fonction continue $\widetilde{f}$ avec $\left\| f-\widetilde{f}\right\|_1\leq\varepsilon$. En appliquant $R_\alpha^n$ et en utilisant l'invariance de $f$ avec l'invariance - par rotation de $\left\| \cdot\right\|$ on obtient + par rotation de $\left\| \cdot\right\|_1$ on obtient $\left\| f-\widetilde{f}\circ R_\alpha^n\right\|_1\leq \varepsilon$ pour tout $n$. Donc $\left\| \widetilde{f}-\widetilde{f}\circ R_\alpha^n\right\|_1\leq @@ -919,44 +944,46 @@ Avant de continuer, nous voulons donner quelques exemples. (voir théorème~\ref{densite-des-rotations}), il s'ensuit avec la continuité de $\widetilde{f}$ que $\left\| \widetilde{f}-\widetilde{f}\circ R_t\right\|_1\leq - 2\varepsilon$ pour tout $t\in\TT$. En posant $c(\widetilde{f})$ la + 3\varepsilon$ pour tout $t\in\TT$. En posant $c(\widetilde{f})$ la fonction constante égale à $\int \widetilde{f}\mathrm{d}\mu$, cela implique que \begin{align*} \left\|\widetilde{f}-c(\widetilde{f})\right\|_1 - &=\int\left|\widetilde{f}(x)-\int \widetilde{f}(x+t)\mathrm{d}\mu(t)\right|\mathrm{d}\mu(x)\\ - &=\int\left|\int\widetilde{f}(x)-\widetilde{f}(x+t)\mathrm{d}\mu(t)\right|\mathrm{d}\mu(x)\\ - &\leq\iint\left|\widetilde{f}(x)-\widetilde{f}(x+t)\right|\mathrm{d}\mu(t)\mathrm{d}\mu(x)\\ - &\leq 2\varepsilon. + &=\int\left|\widetilde{f}(x)-\int \widetilde{f}(x+t)\mathrm{d}t\right|\mathrm{d}x\\ + &=\int\left|\int\widetilde{f}(x)-\widetilde{f}(x+t)\mathrm{d}t\right|\mathrm{d}x\\ + &\leq\iint\left|\widetilde{f}(x)-\widetilde{f}(x+t)\right|\mathrm{d}t\mathrm{d}x\\ + &\leq 3\varepsilon. \end{align*} Donc on a $\left\| f-c(\widetilde{f})\right\|_1\leq - 3\varepsilon$. Alors - \[ + 4\varepsilon$. Alors + \begin{align*} \left| c(f)-c(\widetilde{f})\right| - =\left| \int(f-c(\widetilde{f}))\mathrm{d}\mu\right| - \leq3\varepsilon - \] + =\left| \int(f(x)-c(\widetilde{f}))\mathrm{d}x\right| + \leq \int \left|f(x)-c(\widetilde{f})\right|\mathrm{d}x + =\left\| f-c(\widetilde{f})\right\|_1 + \leq 4\varepsilon + \end{align*} et par l'inégalité du triangle on a $\left\| f-c(f)\right\|_1\leq - 6\varepsilon$. D'après $\varepsilon>0$ était arbitraire, on a + 8\varepsilon$. D'après $\varepsilon>0$ était arbitraire, on a $\left\| f-c(f)\right\|_1=0$ qui implique que $f=c(f)$ presque partout en contradiction. \end{proof} -\begin{proposition}[La duplication est ergodique] - La transformation $T(x)=2x-\left\lfloor 2x\right\rfloor$ est - ergodique par rapport à la mesure de Lebesgue $\mu$. +\begin{proposition}[L'application dilatante est ergodique] + La transformation $T\colon \TT\to\TT$ définie par $T(x)=2x-\left\lfloor + 2x\right\rfloor$ est ergodique par rapport à la mesure de Lebesgue $\mu$. \end{proposition} \begin{proof} -Soit $D_{a,n}$ un intervalle bipartite d'ordre $n$, c'est-à-dire un +Soit $D_{a,n}$ un intervalle dyadique d'ordre $n$, c'est-à-dire un intervalle de la forme $\left(\frac{a}{2^n},\frac{a+1}{2^n}\right)$ -avec $a\in\ZZ$. Soit $E$ un ensemble mesurable. C'est claire que +avec $a\in\ZZ$ et soit $E\subseteq\TT$ un ensemble mesurable. C'est claire que $\mu(T^{-n}E\cap D_{a,n})=2^{-n}\mu(E)$. Donc si $E$ est invariant par $T$ alors $\mu(E\cap D_{a,n})=2^{-n}\mu(E)$. Pour tout $\varepsilon>0$ il existe un ouvert $U$ avec $E\subseteq U$ et $\mu(U\setminus E)\leq\varepsilon$. Pour tout $n$ nous écrivons -$U_n$ pour l'union des intervalles bipartite d'ordre $n$ contenant +$U_n$ pour l'union des intervalles dyadique d'ordre $n$ contenant dans $U$. C'est claire que $U_1\subseteq U_2\subseteq \cdots$. Comme $U$ est ouvert on a $\bigcup_n U_n=U$. Par le théorème de convergence monotone on obtient @@ -967,7 +994,7 @@ Donc si $\mu(E)\neq0$ alors $\mu(U)=1$ et par conséquent $\mu(E)\geq arbitraire, nous avons $\mu(E)=1$. \end{proof} -\section{Moyennes temporelles contre moyennes de l'espace} +\section{Moyennes temporelles contre moyennes spatiales} Soit $(X,\mu,T)$ un système dynamique mesuré avec $\mu(X)=1$ et supposons que $T\colon X\to X$ soit ergodique. Un ``théorème @@ -986,7 +1013,7 @@ f\mathrm{d}\mu$. on a $\langle f_N-f,g\rangle\to0$. \item $f_N\to f$ dans $L^2$ si $\left\| f_N-f\right\|_2\to0$. \item Plus généralement, si $p\geq1$, nous disons que $f_N\to f$ - dans $L^p$ si $\left\| f_N-f\right\|_2\to0$. Normalement nous + dans $L^p$ si $\left\| f_N-f\right\|_p\to0$. Normalement nous prenons $1\leq p\leq 2$. \item Nous disons que $f_N\to f$ simplement presque partout si $f_N(x)\to f(x)$ pour tout $x$ sauf un ensemble de mesure $0$. @@ -998,7 +1025,7 @@ convergence. Si $f_N\to f$ dans $L^2$ alors $f_N\to f$ faiblement dans $L^2$, parce que -\[\langle f_N-f,g\rangle\leq \left\| f_N-f\right\|_2\left\| +\[\lvert\langle f_N-f,g\rangle\rvert\leq \left\| f_N-f\right\|_2\left\| g\right\|_2\] par l'inégalité de Cauchy-Schwarz. Par contre, le contraire n'est pas vrai. En effet, posons $X=\RR/\ZZ$ et $f_N(x)=e^{2\pi i N @@ -1025,7 +1052,7 @@ $f_n\colon [0,1]\to \RR$ définie par $f_n(x)=n$ si $0\leq x\leq 1/n$ et $f_n(x)$ sinon, converge vers zéro presque partout. Mais $f_n$ ne converge pas vers zéro dans n'importe quel $L^p$ avec $p\geq1$. -\section{Moyennes temporelles contre moyennes de l'espace dans faible +\section{Moyennes temporelles contre moyennes spatiales dans faible $L^2$} Nous commençons avec le théorème le plus faible qu'on peut appeler un @@ -1046,16 +1073,16 @@ dual). \begin{proof} Sans perde de généralité nous supposons que $\lVert - f\rVert_2=1$. Comme l'application $U_T\colon L^2(X)\to L^2(X)$ est - une isométrie, on a + f\rVert_2=1$. Comme l'application $U_T\colon L^2(X)\to L^2(X)$ + définie par $U_T(f)=f\circ T$ est une isométrie, on a \[\lVert S_Nf\rVert_2=\lVert \frac1N(f+U_Tf+\cdots+U_T^{N-1}f\rVert_2\leq1.\] Donc $S_Nf$ est dans la boule unitaire de $L^2(X)$. Notons que les moyennes $S_Nf$ sont presque invariantes par $T$ par - \begin{gather}\label{green:eq3.2} + \begin{equation}\label{green:eq3.2} \lVert S_Nf-S_Nf\circ T\rVert_2\leq \frac1N\left(\lVert f\rVert_2+\lVert U_T^Nf\rVert_2\right)\leq \frac2N. - \end{gather} + \end{equation} Suppose que la sous-suite $\left\{S_{N_k}f\right\}_{k\geq1}$ converge faiblement vers $g\in L^2(X)$. D'après (\ref{green:eq3.2}) on voir que aussi $\left\{S_{N_k}f\circ T\right\}_{k\geq1}$ converge @@ -1064,7 +1091,13 @@ dual). partout. Depuis \[\int S_{N_k}f\mathrm{d}\mu - \int g\mathrm{d}\mu =\langle S_{N_k}f-g,1\rangle\to0\] - et $\langle S_Nf,1\rangle=\int S_Nf\mathrm{d}\mu=\overline{f}$ pour + et + \[ + \langle S_Nf,1\rangle=\int S_Nf(x)\mathrm{d}\mu(x) + =\frac{1}{N}\sum_{n=0}^{N-1}\int f\circ T^n(x) \mathrm{d}\mu(x) + =\frac{1}{N}\sum_{n=0}^{N-1}\int f(x) \mathrm{d}\mu(x) + =\overline{f}\] + pour tout $N$, il faut que $g=\overline{f}$. Nous avons montré que toute sous-suite de $\{S_Nf\}_{N\geq1}$ @@ -1124,7 +1157,18 @@ isométries. =\langle UU^*f,f\rangle \leq \lVert UU^* f\rVert\cdot\lVert f\rVert \leq \lVert U^* f\rVert\cdot\lVert f\rVert.\] - + De plus si $f$ est invariante par $U$ elle est aussi invariante par $U^*$. En effet + \begin{align*} + \left\| f- U^*f\right\|^2 + &= \langle f-U^*f, f-U^*f \rangle\\ + &=\langle f, f\rangle - \langle U^*f, f\rangle + -\langle f, U^*f\rangle - \langle U^*f, U^*f\rangle\\ + &=\lVert f\rVert^2 + \lVert U^*f\rVert^2 - \langle f, Uf\rangle + -\langle Uf, f\rangle\\ + &=\lVert f\rVert^2 + \lVert U^*f\rVert^2 - \langle f, f\rangle + -\langle f, f\rangle=-\lVert f\rVert^2 + \lVert U^*f\rVert^2\leq 0. + \end{align*} + L'idée central de la démonstration est l'identification du complément orthogonal de $I$ comme sous-espace fermé des \textit{cocycles}\index{cocycle}. Soit $g\in H$, alors on écrit @@ -1140,8 +1184,14 @@ isométries. f\rangle=0$. D'où \begin{align*} \lVert f-Uf\rVert^2 - &=\langle f, f-Uf\rangle+\langle f-Uf, f\rangle - - \lVert f\rVert^2 + \lVert Uf\rVert^2\\ + &= \langle f-Uf, f-Uf \rangle\\ + &= \langle f + f - Uf - f, f-Uf \rangle\\ + &=\langle f, f-Uf\rangle+\langle f-Uf, f-Uf\rangle + - \langle f, f-Uf\rangle\\ + &=\langle f-Uf, f\rangle + -\langle f-Uf, Uf\rangle- \langle f, f-Uf\rangle\\ + &=-\langle f, Uf\rangle+ \langle Uf, Uf\rangle + -\langle f, f\rangle+ \langle f, Uf\rangle\\ &=- \lVert f\rVert^2 + \lVert Uf\rVert^2\\ &\leq 0. \end{align*} @@ -1156,12 +1206,17 @@ isométries. \lVert S_Nf-\pi(f)\rVert\leq \lVert S_N(\partial g)\rVert+\lVert S_N h\rVert. \end{gather} + Pour le cocycle on obtient + \[ + \lVert S_N(\partial g)\rVert=\lVert\frac1N\sum_{n=0}^{N-1} U^n(g - Ug)\rVert + =\frac1N\lVert g - U^Ng\rVert\leq \frac2N \lVert g\rVert. + \] Puisque $U$ est une contraction on a - \[ \lVert S_Nh\rVert\leq \varepsilon.\] - Maintenant, en télescopant la somme, on voit que - \[ S_N(\partial g)=\frac1N(g-U^Ng),\] - et donc - \[\lVert S_N(\partial g)\rVert\leq \frac{2}{N}\lVert g\rVert.\] + \[ \lVert S_Nh\rVert=\lVert\frac1N\sum_{n=0}^{N-1} U^nh\rVert + \leq\frac1N\sum_{n=0}^{N-1}\lVert U^nh\rVert + \leq\frac1N\sum_{n=0}^{N-1}\lVert h\rVert + \leq\varepsilon. + \] En comparent avec (\ref{green:eq4.1}) on peut voir que \[\lVert S_Nf-\pi(f)\rVert\leq \frac2N\lVert g\rVert+\varepsilon.\] Comme $\varepsilon>0$ était arbitraire, le théorème est démontré. @@ -1361,6 +1416,55 @@ preuve est assez simple. % --------------------------------------------------------------------------- +\chapter{Quelques applications en théorie des nombres} + +\section{Nombres normaux} + +Soit $x\in[0,1]$. Pour $b\geq2$ un entier on a la représentation +\[x=\sum_{i\geq1}\frac{a_i}{b^i}=0.a_1a_2a_3\ldots\] +avec $a_i\in\{0,1,\ldots,b-1\}$. Pour chaque bloc de $\ell$ chiffres +$d_1\ldots d_\ell$, nous comptons la fréquence de son apparition parmi +les premiers $N$ chiffres. On dit que $x$ est normal en base $b$ si +\[ + \lim_{N\to\infty}\frac1N\lvert\left\{0\leq n< N\colon + a_{n+1}=d_1,\ldots, a_{n+\ell}=d_\ell\right\}\rvert=b^{-\ell}, +\] +pour tout $\ell\geq1$ et toute choix de $d_1,\ldots,d_\ell$. Autrement dit le +nombre d'occurrences du bloc $d_1\ldots d_\ell$ et le nombre attendu. + +Un point de vue différent est d'interpréter la normalité par rapport +à la dilatation du cercle $T_k$ avec $k\geq2$ un entier. En +particulière nous avons $a_{n+1}\ldots a_{n+\ell}=d_1\ldots d_\ell$ si +et seulement si $T_k^nx$ est dans l'intervalle +\[ I:=\frac{d_1}{k}+\cdots + + \frac{d_\ell}{k^{\ell}}+\left[0,\frac{1}{k^{\ell}}\right[.\] Puisque les +applications $T_k$ sont ergodique (en effet, nous avons démontré cela +seulement dans le cas $k=2$, mais le cas général se démontrer de même +manier). Alors par théorème d'ergodicité de Birkhoff (théorème \ref{thm-ergodique-simple}) on +a +\[\lim_{N\to\infty}\frac1N\lvert\{\left\{0\leq n< N\colon + a_{n+1}=d_1,\ldots, a_{n+\ell}=d_\ell\right\}\rvert + =\lim_{N\to\infty}\frac{1}{N}\sum_{n=1}^N 1_I(T_k^n x) + =\mu(I)=b^{-\ell}\] +pour presque tout $x$. Il y a seulement un nombre dénombrable des choix pour +$\ell$ et $d_1\ldots d_\ell$ et donc on a que presque tout $x\in[0,1]$ +est normal en base $b$. + +Puisque il y a seulement un nombre dénombrable des entiers $b\geq2$ on +a que presque tout $x$ est normal par rapport aux toutes bases $b$. On +appelle un tel réel \textit{absolument normal}\index{absolument normal}. + + +\section{Le théorème de recurrence de Khintchine} + +\section{Fractions continues et la transformation de Gauss} + +% --------------------------------------------------------------------------- + +% \chapter{Le théorème de Roth} + +% --------------------------------------------------------------------------- + \chapter{Le théorème de Furstenberg et Sárközy} Dans ce chapitre nous allons démontrer le résultat suivant de Furstenberg et