From 99b04bb8ae952787f2767d1077951a12adec947c Mon Sep 17 00:00:00 2001
From: Manfred Madritsch <made@gmx.at>
Date: Sat, 19 Mar 2022 07:59:12 +0100
Subject: [PATCH] the end of Chapter 3

---
 polycopie.tex | 345 +++++++++++++++++++++++++++++++++++++++++++++++++-
 1 file changed, 341 insertions(+), 4 deletions(-)

diff --git a/polycopie.tex b/polycopie.tex
index c673f2a..9b2463c 100644
--- a/polycopie.tex
+++ b/polycopie.tex
@@ -318,7 +318,7 @@ Nous aimerons commencer avec quelques exemples des systèmes dynamiques mesuré.
 Soit $\alpha\in\RR$ un nombre réel, soit $X=\mathbb{U}:=\RR/\ZZ$ le cercle, et
 soit $R_\alpha\colon X\to X$ la rotation donnée par $x\mapsto x+\alpha\pmod 1$.
 
-\paragraph{La multiplication avec $k$.} Soit comme avant $X=\mathbb{U}$ et soit
+\paragraph{L'application dilatante du cercle.} Soit comme avant $X=\mathbb{U}$ et soit
 $k\in \ZZ$. Nous définissons par $S_k\colon X\to X$ la transformation $x\mapsto
 kx\pmod 1$. Celle-ci preserve la mesure de Lebesgue sur $\mathbb{U}$. En
 particulière soit $I=[a,b)$ un intervalle. Alors
@@ -1025,6 +1025,342 @@ $f_n\colon [0,1]\to \RR$ définie par $f_n(x)=n$ si $0\leq x\leq 1/n$
 et $f_n(x)$ sinon, converge vers zéro presque partout. Mais $f_n$ ne
 converge pas vers zéro dans n'importe quel $L^p$ avec $p\geq1$.
 
+\section{Moyennes temporelles contre moyennes de l'espace dans faible
+  $L^2$}
+
+Nous commençons avec le théorème le plus faible qu'on peut appeler un
+théorème ergodique.
+
+\begin{theoreme}
+  Soit $(X,\mu,T)$ un système dynamique mesuré avec $T$ ergodique et
+  soit $f\in L^2(X)$. Alors les moyennes temporelles
+  $S_Nf(x):= \frac1N\sum_{n=0}^{N-1}f(T^nx)$ converge faiblement vers
+  $\overline{f}:=\int f\mathrm{d}\mu$ dans $L^2$.
+\end{theoreme}
+
+L'idée centrale de la démonstration est le théorème de Banach et
+Alaoglu : la boule unitaire est compact en topologie faible (plus
+précisément, le théorème dit que la boule unitaire de $L^2(X)^*$ est
+compact en topologie faible-*; mais $L^2$ est isomorphe avec son
+dual).
+
+\begin{proof}
+  Sans perde de généralité nous supposons que $\lVert
+  f\rVert_2=1$. Comme l'application $U_T\colon L^2(X)\to L^2(X)$ est
+  une isométrie, on a
+  \[\lVert S_Nf\rVert_2=\lVert
+    \frac1N(f+U_Tf+\cdots+U_T^{N-1}f\rVert_2\leq1.\]
+  Donc $S_Nf$ est dans la boule unitaire de $L^2(X)$. Notons que les
+  moyennes $S_Nf$ sont presque invariantes par $T$ par
+  \begin{gather}\label{green:eq3.2}
+    \lVert S_Nf-S_Nf\circ T\rVert_2\leq \frac1N\left(\lVert
+      f\rVert_2+\lVert U_T^Nf\rVert_2\right)\leq \frac2N.
+  \end{gather}
+  Suppose que la sous-suite $\left\{S_{N_k}f\right\}_{k\geq1}$
+  converge faiblement vers $g\in L^2(X)$. D'après (\ref{green:eq3.2})
+  on voir que aussi $\left\{S_{N_k}f\circ T\right\}_{k\geq1}$ converge
+  faiblement vers $g$, donc $g=g\circ T$ presque partout. Comme $T$
+  est ergodique, cela implique que $g$ est constante presque
+  partout. Depuis
+  \[\int S_{N_k}f\mathrm{d}\mu - \int g\mathrm{d}\mu
+    =\langle S_{N_k}f-g,1\rangle\to0\]
+  et $\langle S_Nf,1\rangle=\int S_Nf\mathrm{d}\mu=\overline{f}$ pour
+  tout $N$, il faut que $g=\overline{f}$.
+
+  Nous avons montré que toute sous-suite de $\{S_Nf\}_{N\geq1}$
+  converge faiblement dans $L^2$ vers $\overline{f}$. Ce n'est pas
+  difficile à déduire que par la compacité de la boule unitaire de
+  $L^2(X)$ en topologie faible, la suite $\{S_Nf\}_{N\geq1}$ elle-même
+  converge faiblement vers $\overline{f}$ dans $L^2(X)$.
+\end{proof}
+
+\section[le théorème moyenne]{Moyennes temporelles contre moyennes de l'espace dans $L^2$ :
+le théorème moyenne}
+
+Le théorème principal de cette section supplante complètement celui de
+la section précédente, bien que la preuve soit plus compliquée.
+
+\begin{theoreme}[Théorème moyenne ergodique de von Neumann]\label{thm:ergodique-moyenne}
+  Soit $(X,\mu,T)$ un système dynamique mesuré avec $T$ ergodique. Alors pour toute $f\in
+  L^2(X)$ on a $S_Nf\to\overline{f}$ dans $L^2$.
+\end{theoreme}
+
+Il existe, en fait, une version de ce théorème pour les
+transformations préservant la mesure qui ne sont pas nécessairement
+ergodiques. Soit $I\subseteq L^2(X)$ l'espace fermé des fonctions
+$T$-invariante et soit $\pi(f)$ la projection de $f$ sur $I$.
+
+\begin{theoreme}[Théorème moyenne de von Neumann]\label{thm:moyenne}
+  Soit $(X,\mu,T)$ un système dynamique mesuré. Alors pour tout $f\in
+  L^2(X)$ on a
+  \[\lVert S_Nf-\pi(f)\rVert_2\to0\]
+  pour $N\to\infty$.
+\end{theoreme}
+
+C'est simple de déduire théorème \ref{thm:ergodique-moyenne} de
+théorème \ref{thm:moyenne}, parce que dans le cas ergodique $I$
+ne contient que des fonctions constantes.
+
+La démonstration du théorème moyenne ergodique de von Neumann est
+discuté de manier la plus naturelle en utilisent les isométries
+$U_T\colon L^2(X)\to L^2(X)$ induit par $T$. En fait, avec un peu plus
+d'effort on peut traiter le cas des contractions par rapport aux
+isométries.
+
+\begin{theoreme}[Théorème moyenne ergodique de von Neumann pour les
+  espaces de Hilbert]
+  Soit $H$ un espace de Hilbert, et soir $U\colon H\to H$ une
+  contraction (c.-a.-d. $\lVert U f\rVert\leq \lVert f\rVert$ pour tout
+  $f\in H$). Soit $I\subseteq H$ le sous-espace des éléments
+  invariants par $U$ et soit $\pi\colon H\to I$ la projection
+  associée. Alors les moyennes temporelles
+  $S_Nf:=\frac1N\sum_{n=0}^{N-1} U^nf$ converge vers $\pi(f)$ dans $H$.
+\end{theoreme}
+
+\begin{proof}
+  Soit $U^*$ l'opérateur adjoint, qui est aussi une contraction, parce
+  que pour tout $f\in H$ on a
+  \[\lVert U^*f\rVert^2=\langle U^*f,U^*f\rangle
+    =\langle UU^*f,f\rangle
+    \leq \lVert UU^* f\rVert\cdot\lVert f\rVert
+    \leq \lVert U^* f\rVert\cdot\lVert f\rVert.\]
+
+  L'idée central de la démonstration est l'identification du
+  complément orthogonal de $I$ comme sous-espace fermé des
+  \textit{cocycles}\index{cocycle}. Soit $g\in H$, alors on écrit
+  $\partial g=g-Ug$ pour le cocycle de $g$. En outre, soit $M$
+  le sous-espace fermé de $H$ engendré par les cocyles $\partial
+  g$. Clairement $I\subseteq M^\perp$, parce que si $f$ est invariante
+  par $U$, alors on a
+  \[\langle \partial g, f\rangle
+    =\langle g-Ug, f\rangle
+    =\langle g, f\rangle-\langle g, U^*f\rangle=0.\]
+  Contrairement supposons que $f\in H$ soit orthogonal aux toutes
+  cocyles. Alors, en particulier, $\langle f,\partial
+  f\rangle=0$. D'où
+  \begin{align*}
+    \lVert f-Uf\rVert^2
+    &=\langle f, f-Uf\rangle+\langle f-Uf, f\rangle
+      - \lVert f\rVert^2 + \lVert Uf\rVert^2\\
+    &=- \lVert f\rVert^2 + \lVert Uf\rVert^2\\
+    &\leq 0.
+  \end{align*}
+  Donc $f=Uf$, et autrement dit $f\in I$.
+
+  Maintenant nous avons la décomposition suivante. Soit $f\in H$
+  arbitraire. Alors pour tout $\varepsilon>0$ on peut écrire
+  \[ f=\pi(f)+\partial g + h\]
+  où $\lVert h\rVert\leq \varepsilon$. En prennent des moyennes nous
+  obtenons
+  \begin{gather}\label{green:eq4.1}
+    \lVert S_Nf-\pi(f)\rVert\leq \lVert S_N(\partial g)\rVert+\lVert
+    S_N h\rVert.
+  \end{gather}
+  Puisque $U$ est une contraction on a
+  \[ \lVert S_Nh\rVert\leq \varepsilon.\]
+  Maintenant, en télescopant la somme, on voit que
+  \[ S_N(\partial g)=\frac1N(g-U^Ng),\]
+  et donc
+  \[\lVert S_N(\partial g)\rVert\leq \frac{2}{N}\lVert g\rVert.\]
+  En comparent avec (\ref{green:eq4.1}) on peut voir que
+  \[\lVert S_Nf-\pi(f)\rVert\leq \frac2N\lVert g\rVert+\varepsilon.\]
+  Comme $\varepsilon>0$ était arbitraire, le théorème est démontré.
+\end{proof}
+
+Nous remarquons que le théorèmes \ref{thm:ergodique-moyenne} et
+\ref{thm:moyenne} sont des conséquences faciles de ce dernier
+théorème.
+
+\section{Le théorème ergodique presque partout}
+
+Les théorème ergodiques ponctuels capturent l'essence de la théorie
+ergodique. Nous allons donner une preuve plus ``détaillée'' que
+d'habitude.
+
+\begin{theoreme}[Théorème ergodique de Birkhoff]
+  \label{thm-ergodique-simple}
+  Soit $(X,\mu,T)$ un système dynamique mesuré et soit $f\in
+  L^1(X)$. Soit $\mathcal{F}_0$ la tribu des ensembles $T$ invariants
+  et écrivons $\pi\colon L^1(X)\to L^1(X)$ pour l'opérateur de
+  l'espérance conditionnelle $f\mapsto \mathbb{E}(f\vert
+  \mathcal{F}_0)$. Alors $S_Nf\to\pi(f)$ converge simplement presque
+  partout. En particulière, si $T$ est ergodique les moyennes
+  temporelle $S_Nf$ converge simplement vers les moyennes de l'espace
+  $\overline{f}=\int f\mathrm{d}\mu$ presque partout.
+\end{theoreme}
+
+L'ingrédient clé est un résultat appelé le théorème ergodique maximal.
+Pour tout entier $L\geq1$ on écrit $S^*_Lf(x):=\max_{M\leq
+  L}\frac{1}{M}\sum_{m=0}^{M-1}f(T^mx)$. Soit
+$S^*f(x):=\sup_LS^*_Lf(x)$. Dans le jargon de l'analyse, le théorème
+ergodique maximal est l'affirmation que l'opérateur $S^*$ satisfait à
+une inégalité de type (1,1) faible.
+
+\begin{proposition}[Théorème ergodique maximal]
+  \label{thm-ergodique-max}
+  Soit $(X,\mu,T)$ un
+  système dynamique mesuré et soit $\lambda>0$. Alors $\mu\{x\colon
+  S^*f(x)\geq\lambda\}\leq 4\lVert f\rVert_1/\lambda$.
+\end{proposition}
+
+\begin{proof}
+  Nous appliquons l'inégalité maximale de Hardy et Littlewood aux
+  fonctions $F\colon \mathbb{Z}\to\mathbb{R}$. Étant donné une telle
+  fonction, définissons la fonction maximal $F^*$ par
+  \[ F^*(x):=\sup_{M\geq 1}\frac{1}{M}\sum_{m=0}^{M-1}F(x+m).\]
+\end{proof}
+
+L'inégalité maximale de Hardy et Littlewood dit que l'opérateur
+maximal $F\mapsto F^*$ est de type $(1,1)$ faible. Nous remarquons
+qu'il est possible de généraliser ce théorème de nombreuses manières
+différentes, et il existe une branche entière de l'analyse consacrée à
+l'étude de tels théorèmes. Dans ce cas particulier, cependant, la
+preuve est assez simple.
+
+\begin{theoreme}[Inégalité maximale de Hardy et LIttlewood pour la
+  ligne] Soit $\lambda>0$. Alors on a $\#\{x\colon
+  F^*(x)\geq\lambda\}\leq 4\lVert
+  F\rVert_{\ell^1(\mathbb{Z}}/\lambda$.
+\end{theoreme}
+
+\begin{proof}
+  Soit $A\subseteq\mathbb{Z}$ l'ensemble de tout $x$ tel que
+  $F^*(x)\geq\lambda$. Alors nous associons à tout $x\in A$ un entier
+  $M=M(x)\geq1$ tel que
+  $\frac{1}{M}\sum_{m=0}^{M-1}F(x+m)\geq\lambda/2$. Posons
+  $I_x:=\{x,\ldots, x+M-1\}$; donc $F$ est en moyenne au moins
+  $\lambda/2$ à tout élément de $I_x$.
+
+  L'affirmation est la suivante qu'il existe un ensemble $A'\subseteq
+  A$ tel que les intervalles $I_x$ avec $x\in A'$ sont disjoints, et
+  tel que $\sum_{x\in A'}\lvert
+  I_x\rvert\geq\frac12\lvert\bigcup_{x\in A}I_x\rvert$. Une fois ceci
+  prouvé, nous avons
+  \[\lVert F\rVert_{\ell^1(\mathbb{Z})}
+    \geq\frac\lambda2\sum_{x\in A'}\lvert I_x\rvert
+    \geq\frac\lambda4\lvert\bigcup_{x\in A}I_x\rvert
+    \geq\frac\lambda4\lvert A\rvert,\]
+  ce qui est le résultat que nous revendiquons.
+
+  Il reste à démontrer l'affirmation. Tout d'abord, passons à une
+  sous-collection minimal $\{ I_x\colon x\in A_0\}$ avec la propriété
+  que $\bigcup_{x\in A_0}I_x=\bigcup_{x\in A}I_x$. Par une simple
+  inspection, cette sous-collection a la propriété qu'aucun point $y$
+  ne se trouve dans trois des $I_x$. En étiquetant les intervalles
+  comme $I_j:=\{a_j,\ldots, b_j\}$ avec $a_1\leq a_2\leq \cdots a_k$
+  on peut voir que $b_1\leq a_3, b_2\leq a_4,\ldots b_{k-2}\leq
+  a_k$. Alors les deux collections $I_1\cup I_3\cup\ldots$ et $I_2\cup
+  I_4\cup \ldots$ sont constitués de intervalles disjoints. Si l'on
+  passe à celle de ces deux collections qui a la plus grande mesure
+  total, on a le résultat demandé.
+\end{proof}
+
+\begin{proof}[Démonstration du théorème \ref{thm-ergodique-max}]
+  Soit $\lambda>0$, soient $N\gg L\geq1$ des entiers et soit $x\in X$
+  fixé. Nous appliquons l'inégalité de Hardy et Littlewood maximal à
+  une version tronquée de la fonction $n\mapsto f(T^nx)$, plus
+  précisément,
+  \[F(n):=\begin{cases}f(T^nx) &\text{si }0\leq n<N+L\text{ et}\\
+      0 &\text{sinon.}
+    \end{cases}\]
+  On obtient l'inégalité
+  \[\lvert\left\{n\in\{1,\ldots N\}\colon
+      \max_{M\leq L}\frac1M \sum_{m=0}^{M-1}
+      f(T^{n+m}x)\geq\lambda\right\}\rvert
+    \leq\frac{4\sum_{0\leq j<N+L}\lvert f(T^jx)\rvert}{\lambda}.\]
+  En intégrant sur $x\in X$ et en utilisant l'invariance de $\mu$ par
+  $T$ on obtient
+  \[\int_{X}\lvert\left\{n\in\{1,\ldots N\}\colon
+      \max_{M\leq L}\frac1M \sum_{m=0}^{M-1}
+      f(T^{n+m}x)\geq\lambda\right\}\rvert \leq\frac{C(N+L)\lVert
+      f\rVert_1}{\lambda}.\] Maintenant, la fonction indicatrice de
+  l'événement
+  $\max_{M\leq L}\frac1M \sum_{m=0}^{M-1} f(T^{n+m}x)\geq\lambda$ est
+  une fonction mesurable de $n$ et $x$ sur l'espace
+  $\ZZ\times\NN$. Par le théorème de Fibini nous pouvons échanger
+  l'ordre pour obtenir
+  \[\sum_{n=1}^N\mu\left(\left\{x\in X\colon
+      \max_{M\leq L}\frac1M \sum_{m=0}^{M-1}
+      f(T^{n+m}x)\geq\lambda\right\}\right)
+    \leq\frac{C(N+L)\lVert f\rVert_1}{\lambda}.\]
+  Encore par l'invariance de $\mu$ par $T$ nous obtenons
+  \[N\mu\left(\left\{x\in X\colon
+      \max_{M\leq L}\frac1M \sum_{m=0}^{M-1}
+      f(T^{m}x)\geq\lambda\right\}\right)
+    \leq\frac{C(N+L)\lVert f\rVert_1}{\lambda}.\]
+  Autrement dit on a
+  \[\mu\left(\left\{x\in X\colon
+      S_L^*f(x)\geq\lambda\right\}\right)
+  \leq\frac{C(N+L)\lVert f\rVert_1}{N\lambda}.\]
+  En laissant $L$ et $N$ tends vers l'infinie, avec $N$ plus vite que
+  $L$, on obtient
+  \[\mu\left(\left\{x\in X\colon
+      S^*f(x)\geq\lambda\right\}\right)
+  \leq\frac{C\lVert f\rVert_1}{\lambda}\]
+  qui est le théorème avec une constante plus faible que demandée.
+\end{proof}
+
+\begin{proof}[Démonstration du théorème \ref{thm-ergodique-simple}]
+  Il suffit de démontrer pour tout $\varepsilon>0$ que
+  \[ E_\varepsilon:=\{x\in X\colon \limsup_{N\to\infty} \lvert
+    S_Nf(x)-\pi(f)\rvert\geq\varepsilon\}\]
+  a la mesure zéro.
+
+  Soit $\delta>0$. Dans la démonstration du théorème de von Neumann
+  (théorème \ref{thm:ergodique-moyenne}) nous avons décomposé un
+  fonction $f\in L^2(X)$ comme
+  \begin{gather}\label{green:eq5.1}
+    f=\pi(f)+\partial g+h,
+  \end{gather}
+  où $g\in L^2(X)$ et $\lVert h\rVert_2\leq \delta$.
+
+  Dans le théorème ergodic de Birkhoff, nous opérons sous l'hypothèse
+  plus faible que $f\in L^1(X)$, et pour traiter cette hypothèse, nous
+  devons remplacer (\ref{green:eq5.1}) par une décomposition
+  légèrement plus raffinée. Mais $L^2(X)$ est dense dans $L^1(X)$ (en
+  effet, $\mathcal{C}(X)$ est dense dans $L^1(X)$), et alors pour tout
+  $\delta>0$ on peut trouver $f_0\in L^2(X)$ avec $\lVert
+  f-f_0\rVert\leq\delta$. En appliquant (\ref{green:eq5.1}) à cette
+  fonction on obtient la décomposition
+  \[ f_0=\pi(f_0)+\partial g_0+h_0\]
+  avec $\lVert h_0\rVert_2\leq \delta$. Alors
+  \[ f=\pi(f)+\partial g_0+h_1,\]
+  où $h_1:=h_0+(f-f_0)-(\pi(f)-\pi(f_0))$. Notons que $\lVert
+  h_1\rVert_1\leq \lVert h_0\rVert_1+2\delta\leq 3\delta$.
+
+  C'est important d'avoir un peu de contrôle sur $g_0$, qui est
+  maintenant dans $L^2(X)$. Depuis $L^\infty(X)$ est dense dans
+  $L^2(X)$, il existe $g\in L^\infty(X)$ avec $\lVert
+  g-g_0\rVert_2\leq\delta$. Alors notre inégalité devient
+  \[f=\pi(f)+\partial g+h,\]
+  où $h=h_1+\partial(g_0-g)$; donc $\lVert h\rVert_1\leq
+  3\delta+\lVert\partial(g-g_0)\rVert_2^{1/2}\leq
+  3\delta+(2\delta)^{1/2}$. En choisissant $\delta$ nous pouvons
+  supposer que $\lVert h\rVert_1\leq \delta$.
+
+  Nous avons clairement, pour tout $x\in X$,
+  \[\lvert S_Nf(x)-\pi(f)\rvert
+    \leq \lvert S_N(\partial g)(x)\rvert + \lvert S_Nh(x)\rvert.\]
+  Le premier terme à droite peut être analysé comme précédemment ; la
+  somme se télescope et on obtient
+  \[\lvert S_N(\partial g)(x)\rvert
+    =\lvert\frac1N \left(g(x)-g(T^{n-1}(x))\right)\rvert,\]
+  qui tends vers zéro pour tout $x$ puisque $g\in L^\infty(X)$. Donc
+  $E_\varepsilon$ est contenu, sauf un ensemble de mesure zéro,
+  dans l'ensemble
+  \[\left\{x\in X\colon \limsup_{N\to\infty}\lvert
+      S_Nh(x)\rvert\geq\varepsilon\right\}.\]
+  Ceci est contenu dans l'ensemble
+  \[\left\{x\in X\colon \lvert
+      S^*h(x)\rvert\geq\varepsilon\right\}\]
+  qui, par le théorème ergodique maximale (théorème
+  \ref{thm-ergodique-max}) et la borne pour $\lVert h\rVert_1$ a une
+  mesure plus petit que $4\delta/\varepsilon$. Puisque $\delta$ était
+  arbitraire on a $\mu(E_\varepsilon)=0$ comme demandé.
+\end{proof}
+
+% ---------------------------------------------------------------------------
+
 \chapter{Le théorème de Furstenberg et Sárközy}
 
 Dans ce chapitre nous allons démontrer le résultat suivant de Furstenberg et
@@ -1032,9 +1368,10 @@ Sárközy. C'est peut-être une application très simples des idées de la théo
 ergodique aux questions de la théorie combinatoire de nombres.
 
 \begin{theoreme}
-  Soit $\delta>0$. Il existe $N_0(\delta)$ tel que si $N\geq N_0(\delta)$ et si 
-  $A\subset\{1,\ldots,N\}$ est tel que $\left| A\right|\geq \delta N$, alors ils existent
-  deux éléments $a,a'\in A$ dont la différence est un carré.
+  Soit $\delta>0$. Il existe $N_0(\delta)$ tel que si
+  $N\geq N_0(\delta)$ et si $A\subset\{1,\ldots,N\}$ est tel que
+  $\left| A\right|\geq \delta N$, alors ils existent deux éléments
+  $a,a'\in A$ dont la différence est un carré.
 \end{theoreme}
 
 \section{Le théorème spectral de Bochner et Herglotz}
-- 
GitLab