diff --git a/polycopie.tex b/polycopie.tex
index 9b2463c0ee8ced7402c4221a0fd23a113da12d0e..13bb2e7fcda4e4397b8fe74d208d648a8f5fa58c 100644
--- a/polycopie.tex
+++ b/polycopie.tex
@@ -363,7 +363,7 @@ différentes. Par exemple, si $d=2$ nous avons les trois formes suivantes :
 
 \paragraph{Le shift sur un alphabet fini.}
 Dans les exemples précendants l'espace $X$ était toujours un sous-espace compact
-d'un manifold. Cet exemple est très different et il a plusieurs applications en
+d'un manifold. Cet exemple est très différent et il a plusieurs applications en
 théorie des nombres dans les pages suivantes.
 
 Soit $X=\{0,1,\ldots,k-1\}^\ZZ$, \textit{i.e.} l'espace des mots double-infinis
@@ -882,15 +882,44 @@ l'objet central dans l'étude de la théorie ergodique.
   $T^{-1}E=E$) est soit $0$ soit $1$.
 \end{definition}
 
-Il n'est pas difficile de voir que $T$ est ergodique si et seulement
-si les fonctions mesurables et invariantes par $T$ (fonctions $f$
-telles que $f=f\circ T$) sont des fonctions constantes presque
-partout.
+\begin{proposition}\label{prop:equivalent-ergodicity}
+  Soit $(X,T,\mu)$ un système dynamique
+  mesuré. Alors les assertions suivantes sont équivalentes :
+  \begin{enumerate}[(1)]
+  \item $T$ est ergodique ;
+  \item toute application $f\colon X\to \RR$ mesurable, telle que
+    $f\circ T=f$ presque partout, est presque partout constante ;
+  \item toute application $f\in L^1(X)$, telle que $f\circ T=f$
+    presque partout, est presque partout constante ;
+  \item toute application $f\in L^2(X)$, telle que $f\circ T=f$
+    presque partout, est presque partout constante.
+  \end{enumerate}
+\end{proposition}
+
+\begin{proof}
+  \begin{itemize}
+    \item (2) $\Rightarrow$ (3) : Toute $f\in L^1(X)$ est mesurable.
+    \item (3) $\Rightarrow$ (4) : $L^1(X)\subset L^2(X)$.
+    \item (4) $\Rightarrow$ (1) : Soit $E\subseteq X$ mesurable tel que
+    $T^{-1}E=E$ et $1_E$ la fonction caractéristique de $E$. Alors $1_E\in
+    L^2(X)$ et donc avec (4) $1_E$ est constante presque partout. Donc $1_E$ est
+    égale à $0$ ou à $1$ presque partout et $\mu(E)=0$ ou $1$.
+    \item (1) $\Rightarrow$ (2) : Si $f$ n'est pas
+    constante presque partout, il existe un réel $x$ tel que, en notant
+    $A'=f^{-1}([x,+\infty])$, on a $0<\mu(A')<1$. L'égalité $f\circ T=f$
+    presque partout assure que les ensembles $A'$ et $T^{-1}(A')$
+    coïncident en dehors d'une partie négligeable. L'ensemble
+    $A=\bigcap_{p\in\NN} \bigcup_{n\geq p}T^{-n}(A')$ coïncide alors
+    avec $A'$ en dehors d'une partie négligeable. En particulier, on a
+    $0<\mu(A)<1$. comme $T^{-1}(A)=A$, ceci contredit l'ergodicité de $\mu$.
+  \end{itemize}
+
+\end{proof}
 
 L'ergodicité semble être une propriété plutôt faible. Remarquablement,
 c'est exactement la propriété qui nous permet de faire des assertions
-rigoureuses de la forme ``les moyennes temporelles tendent vers les
-moyennes de l'espace''.
+rigoureuses de la forme ``les moyennes temporelles tendent vers la
+moyenne spatiale''.
 
 Avant de continuer, nous voulons donner quelques exemples.
 
@@ -901,17 +930,13 @@ Avant de continuer, nous voulons donner quelques exemples.
 \end{proposition}
 
 \begin{proof}
-  Soit $f\colon \TT \to \RR$ une fonction mesurable et invariante par
-  $R_\alpha$ qui n'est pas constante presque partout. Chaque niveau
-  $\{x\colon s\leq f(x)\leq t\}$ est aussi invariante par $R_\alpha$ :
-  en passant par un ensemble de niveau où la fonction n'est pas
-  constante presque partout nous pouvons supposer que $f\in
-  L^1(\TT)$. Soit $\varepsilon >0$. Comme l'espace des fonctions
-  continues $C(\TT)$ est dense dans $L^1(\TT)$, il existe une fonction
+  Nous utilisons la version (3) du proposition \ref{prop:equivalent-ergodicity}. 
+  Soit $\varepsilon >0$. Comme l'espace des fonctions
+  continues $\mathcal{C}(\TT)$ est dense dans $L^1(\TT)$, il existe une fonction
   continue $\widetilde{f}$ avec
   $\left\| f-\widetilde{f}\right\|_1\leq\varepsilon$. En appliquant
   $R_\alpha^n$ et en utilisant l'invariance de $f$ avec l'invariance
-  par rotation de $\left\| \cdot\right\|$ on obtient
+  par rotation de $\left\| \cdot\right\|_1$ on obtient
   $\left\| f-\widetilde{f}\circ R_\alpha^n\right\|_1\leq \varepsilon$
   pour tout $n$. Donc
   $\left\| \widetilde{f}-\widetilde{f}\circ R_\alpha^n\right\|_1\leq
@@ -919,44 +944,46 @@ Avant de continuer, nous voulons donner quelques exemples.
   (voir théorème~\ref{densite-des-rotations}), il s'ensuit avec la
   continuité de $\widetilde{f}$ que
   $\left\| \widetilde{f}-\widetilde{f}\circ R_t\right\|_1\leq
-  2\varepsilon$ pour tout $t\in\TT$. En posant $c(\widetilde{f})$ la
+  3\varepsilon$ pour tout $t\in\TT$. En posant $c(\widetilde{f})$ la
   fonction constante égale à $\int \widetilde{f}\mathrm{d}\mu$, cela
   implique que
   \begin{align*}
     \left\|\widetilde{f}-c(\widetilde{f})\right\|_1
-    &=\int\left|\widetilde{f}(x)-\int \widetilde{f}(x+t)\mathrm{d}\mu(t)\right|\mathrm{d}\mu(x)\\
-    &=\int\left|\int\widetilde{f}(x)-\widetilde{f}(x+t)\mathrm{d}\mu(t)\right|\mathrm{d}\mu(x)\\
-    &\leq\iint\left|\widetilde{f}(x)-\widetilde{f}(x+t)\right|\mathrm{d}\mu(t)\mathrm{d}\mu(x)\\
-    &\leq 2\varepsilon.
+    &=\int\left|\widetilde{f}(x)-\int \widetilde{f}(x+t)\mathrm{d}t\right|\mathrm{d}x\\
+    &=\int\left|\int\widetilde{f}(x)-\widetilde{f}(x+t)\mathrm{d}t\right|\mathrm{d}x\\
+    &\leq\iint\left|\widetilde{f}(x)-\widetilde{f}(x+t)\right|\mathrm{d}t\mathrm{d}x\\
+    &\leq 3\varepsilon.
   \end{align*}
   Donc on a $\left\| f-c(\widetilde{f})\right\|_1\leq
-  3\varepsilon$. Alors
-  \[
+  4\varepsilon$. Alors
+  \begin{align*}
     \left| c(f)-c(\widetilde{f})\right|
-    =\left| \int(f-c(\widetilde{f}))\mathrm{d}\mu\right|
-    \leq3\varepsilon
-  \]
+    =\left| \int(f(x)-c(\widetilde{f}))\mathrm{d}x\right|
+    \leq \int \left|f(x)-c(\widetilde{f})\right|\mathrm{d}x
+    =\left\| f-c(\widetilde{f})\right\|_1
+    \leq 4\varepsilon  
+  \end{align*}
   et par l'inégalité du triangle on a $\left\| f-c(f)\right\|_1\leq
-  6\varepsilon$. D'après $\varepsilon>0$ était arbitraire, on a
+  8\varepsilon$. D'après $\varepsilon>0$ était arbitraire, on a
   $\left\| f-c(f)\right\|_1=0$ qui implique que $f=c(f)$ presque
   partout en contradiction.
 \end{proof}
 
-\begin{proposition}[La duplication est ergodique]
-  La transformation $T(x)=2x-\left\lfloor 2x\right\rfloor$ est
-  ergodique par rapport à la mesure de Lebesgue $\mu$.
+\begin{proposition}[L'application dilatante est ergodique]
+  La transformation $T\colon \TT\to\TT$ définie par $T(x)=2x-\left\lfloor
+  2x\right\rfloor$ est ergodique par rapport à la mesure de Lebesgue $\mu$.
 \end{proposition}
 
 \begin{proof}
-Soit $D_{a,n}$ un intervalle bipartite d'ordre $n$, c'est-à-dire un
+Soit $D_{a,n}$ un intervalle dyadique d'ordre $n$, c'est-à-dire un
 intervalle de la forme $\left(\frac{a}{2^n},\frac{a+1}{2^n}\right)$
-avec $a\in\ZZ$. Soit $E$ un ensemble mesurable. C'est claire que
+avec $a\in\ZZ$ et soit $E\subseteq\TT$ un ensemble mesurable. C'est claire que
 $\mu(T^{-n}E\cap D_{a,n})=2^{-n}\mu(E)$. Donc si $E$ est invariant
 par $T$ alors $\mu(E\cap D_{a,n})=2^{-n}\mu(E)$.
 
 Pour tout $\varepsilon>0$ il existe un ouvert $U$ avec $E\subseteq U$
 et $\mu(U\setminus E)\leq\varepsilon$. Pour tout $n$ nous écrivons
-$U_n$ pour l'union des intervalles bipartite d'ordre $n$ contenant
+$U_n$ pour l'union des intervalles dyadique d'ordre $n$ contenant
 dans $U$. C'est claire que $U_1\subseteq U_2\subseteq \cdots$. Comme
 $U$ est ouvert on a $\bigcup_n U_n=U$. Par le théorème de convergence
 monotone on obtient
@@ -967,7 +994,7 @@ Donc si $\mu(E)\neq0$ alors $\mu(U)=1$ et par conséquent $\mu(E)\geq
 arbitraire, nous avons $\mu(E)=1$.
 \end{proof}
 
-\section{Moyennes temporelles contre moyennes de l'espace}
+\section{Moyennes temporelles contre moyennes spatiales}
 
 Soit $(X,\mu,T)$ un système dynamique mesuré avec $\mu(X)=1$ et
 supposons que $T\colon X\to X$ soit ergodique. Un ``théorème
@@ -986,7 +1013,7 @@ f\mathrm{d}\mu$.
     on a $\langle f_N-f,g\rangle\to0$.
   \item $f_N\to f$ dans $L^2$ si $\left\| f_N-f\right\|_2\to0$.
   \item Plus généralement, si $p\geq1$, nous disons que $f_N\to f$
-    dans $L^p$ si $\left\| f_N-f\right\|_2\to0$. Normalement nous
+    dans $L^p$ si $\left\| f_N-f\right\|_p\to0$. Normalement nous
     prenons $1\leq p\leq 2$.
   \item Nous disons que $f_N\to f$ simplement presque partout si
     $f_N(x)\to f(x)$ pour tout $x$ sauf un ensemble de mesure $0$.
@@ -998,7 +1025,7 @@ convergence.
 
 Si $f_N\to f$ dans $L^2$ alors $f_N\to f$ faiblement dans $L^2$, parce
 que
-\[\langle f_N-f,g\rangle\leq \left\| f_N-f\right\|_2\left\|
+\[\lvert\langle f_N-f,g\rangle\rvert\leq \left\| f_N-f\right\|_2\left\|
     g\right\|_2\]
 par l'inégalité de Cauchy-Schwarz. Par contre, le contraire n'est pas
 vrai. En effet, posons $X=\RR/\ZZ$ et $f_N(x)=e^{2\pi i N
@@ -1025,7 +1052,7 @@ $f_n\colon [0,1]\to \RR$ définie par $f_n(x)=n$ si $0\leq x\leq 1/n$
 et $f_n(x)$ sinon, converge vers zéro presque partout. Mais $f_n$ ne
 converge pas vers zéro dans n'importe quel $L^p$ avec $p\geq1$.
 
-\section{Moyennes temporelles contre moyennes de l'espace dans faible
+\section{Moyennes temporelles contre moyennes spatiales dans faible
   $L^2$}
 
 Nous commençons avec le théorème le plus faible qu'on peut appeler un
@@ -1046,16 +1073,16 @@ dual).
 
 \begin{proof}
   Sans perde de généralité nous supposons que $\lVert
-  f\rVert_2=1$. Comme l'application $U_T\colon L^2(X)\to L^2(X)$ est
-  une isométrie, on a
+  f\rVert_2=1$. Comme l'application $U_T\colon L^2(X)\to L^2(X)$
+  définie par $U_T(f)=f\circ T$ est une isométrie, on a
   \[\lVert S_Nf\rVert_2=\lVert
     \frac1N(f+U_Tf+\cdots+U_T^{N-1}f\rVert_2\leq1.\]
   Donc $S_Nf$ est dans la boule unitaire de $L^2(X)$. Notons que les
   moyennes $S_Nf$ sont presque invariantes par $T$ par
-  \begin{gather}\label{green:eq3.2}
+  \begin{equation}\label{green:eq3.2}
     \lVert S_Nf-S_Nf\circ T\rVert_2\leq \frac1N\left(\lVert
       f\rVert_2+\lVert U_T^Nf\rVert_2\right)\leq \frac2N.
-  \end{gather}
+  \end{equation}
   Suppose que la sous-suite $\left\{S_{N_k}f\right\}_{k\geq1}$
   converge faiblement vers $g\in L^2(X)$. D'après (\ref{green:eq3.2})
   on voir que aussi $\left\{S_{N_k}f\circ T\right\}_{k\geq1}$ converge
@@ -1064,7 +1091,13 @@ dual).
   partout. Depuis
   \[\int S_{N_k}f\mathrm{d}\mu - \int g\mathrm{d}\mu
     =\langle S_{N_k}f-g,1\rangle\to0\]
-  et $\langle S_Nf,1\rangle=\int S_Nf\mathrm{d}\mu=\overline{f}$ pour
+  et
+  \[
+    \langle S_Nf,1\rangle=\int S_Nf(x)\mathrm{d}\mu(x)
+    =\frac{1}{N}\sum_{n=0}^{N-1}\int f\circ T^n(x) \mathrm{d}\mu(x)
+    =\frac{1}{N}\sum_{n=0}^{N-1}\int f(x) \mathrm{d}\mu(x)
+    =\overline{f}\]
+  pour
   tout $N$, il faut que $g=\overline{f}$.
 
   Nous avons montré que toute sous-suite de $\{S_Nf\}_{N\geq1}$
@@ -1124,7 +1157,18 @@ isométries.
     =\langle UU^*f,f\rangle
     \leq \lVert UU^* f\rVert\cdot\lVert f\rVert
     \leq \lVert U^* f\rVert\cdot\lVert f\rVert.\]
-
+  De plus si $f$ est invariante par $U$ elle est aussi invariante par $U^*$. En effet
+  \begin{align*}
+    \left\| f- U^*f\right\|^2
+    &= \langle f-U^*f, f-U^*f \rangle\\
+    &=\langle f, f\rangle - \langle U^*f, f\rangle
+    -\langle f, U^*f\rangle - \langle U^*f, U^*f\rangle\\
+    &=\lVert f\rVert^2 + \lVert U^*f\rVert^2 - \langle f, Uf\rangle
+    -\langle Uf, f\rangle\\
+    &=\lVert f\rVert^2 + \lVert U^*f\rVert^2 - \langle f, f\rangle
+    -\langle f, f\rangle=-\lVert f\rVert^2 + \lVert U^*f\rVert^2\leq 0.
+  \end{align*}
+  
   L'idée central de la démonstration est l'identification du
   complément orthogonal de $I$ comme sous-espace fermé des
   \textit{cocycles}\index{cocycle}. Soit $g\in H$, alors on écrit
@@ -1140,8 +1184,14 @@ isométries.
   f\rangle=0$. D'où
   \begin{align*}
     \lVert f-Uf\rVert^2
-    &=\langle f, f-Uf\rangle+\langle f-Uf, f\rangle
-      - \lVert f\rVert^2 + \lVert Uf\rVert^2\\
+    &= \langle f-Uf, f-Uf \rangle\\
+    &= \langle f + f - Uf - f, f-Uf \rangle\\
+    &=\langle f, f-Uf\rangle+\langle f-Uf, f-Uf\rangle
+      - \langle f, f-Uf\rangle\\
+    &=\langle f-Uf, f\rangle
+     -\langle f-Uf, Uf\rangle- \langle f, f-Uf\rangle\\
+    &=-\langle f, Uf\rangle+ \langle Uf, Uf\rangle
+      -\langle f, f\rangle+ \langle f, Uf\rangle\\
     &=- \lVert f\rVert^2 + \lVert Uf\rVert^2\\
     &\leq 0.
   \end{align*}
@@ -1156,12 +1206,17 @@ isométries.
     \lVert S_Nf-\pi(f)\rVert\leq \lVert S_N(\partial g)\rVert+\lVert
     S_N h\rVert.
   \end{gather}
+  Pour le cocycle on obtient
+  \[
+    \lVert S_N(\partial g)\rVert=\lVert\frac1N\sum_{n=0}^{N-1} U^n(g - Ug)\rVert
+    =\frac1N\lVert g - U^Ng\rVert\leq \frac2N \lVert g\rVert.
+  \]
   Puisque $U$ est une contraction on a
-  \[ \lVert S_Nh\rVert\leq \varepsilon.\]
-  Maintenant, en télescopant la somme, on voit que
-  \[ S_N(\partial g)=\frac1N(g-U^Ng),\]
-  et donc
-  \[\lVert S_N(\partial g)\rVert\leq \frac{2}{N}\lVert g\rVert.\]
+  \[ \lVert S_Nh\rVert=\lVert\frac1N\sum_{n=0}^{N-1} U^nh\rVert
+  \leq\frac1N\sum_{n=0}^{N-1}\lVert U^nh\rVert
+  \leq\frac1N\sum_{n=0}^{N-1}\lVert h\rVert
+  \leq\varepsilon.
+  \]
   En comparent avec (\ref{green:eq4.1}) on peut voir que
   \[\lVert S_Nf-\pi(f)\rVert\leq \frac2N\lVert g\rVert+\varepsilon.\]
   Comme $\varepsilon>0$ était arbitraire, le théorème est démontré.
@@ -1361,6 +1416,55 @@ preuve est assez simple.
 
 % ---------------------------------------------------------------------------
 
+\chapter{Quelques applications en théorie des nombres}
+
+\section{Nombres normaux}
+
+Soit $x\in[0,1]$. Pour $b\geq2$ un entier on a la représentation
+\[x=\sum_{i\geq1}\frac{a_i}{b^i}=0.a_1a_2a_3\ldots\]
+avec $a_i\in\{0,1,\ldots,b-1\}$. Pour chaque bloc de $\ell$ chiffres
+$d_1\ldots d_\ell$, nous comptons la fréquence de son apparition parmi
+les premiers $N$ chiffres. On dit que $x$ est normal en base $b$ si
+\[
+  \lim_{N\to\infty}\frac1N\lvert\left\{0\leq n< N\colon
+  a_{n+1}=d_1,\ldots, a_{n+\ell}=d_\ell\right\}\rvert=b^{-\ell},
+\]
+pour tout $\ell\geq1$ et toute choix de $d_1,\ldots,d_\ell$. Autrement dit le
+nombre d'occurrences du bloc $d_1\ldots d_\ell$ et le nombre attendu.
+
+Un point de vue différent est d'interpréter la normalité par rapport
+à la dilatation du cercle $T_k$ avec $k\geq2$ un entier. En
+particulière nous avons $a_{n+1}\ldots a_{n+\ell}=d_1\ldots d_\ell$ si
+et seulement si $T_k^nx$ est dans l'intervalle
+\[ I:=\frac{d_1}{k}+\cdots +
+  \frac{d_\ell}{k^{\ell}}+\left[0,\frac{1}{k^{\ell}}\right[.\] Puisque les
+applications $T_k$ sont ergodique (en effet, nous avons démontré cela
+seulement dans le cas $k=2$, mais le cas général se démontrer de même
+manier). Alors par théorème d'ergodicité de Birkhoff (théorème \ref{thm-ergodique-simple}) on
+a
+\[\lim_{N\to\infty}\frac1N\lvert\{\left\{0\leq n< N\colon
+    a_{n+1}=d_1,\ldots, a_{n+\ell}=d_\ell\right\}\rvert
+  =\lim_{N\to\infty}\frac{1}{N}\sum_{n=1}^N 1_I(T_k^n x)
+  =\mu(I)=b^{-\ell}\]
+pour presque tout $x$. Il y a seulement un nombre dénombrable des choix pour
+$\ell$ et $d_1\ldots d_\ell$ et donc on a que presque tout $x\in[0,1]$
+est normal en base $b$.
+
+Puisque il y a seulement un nombre dénombrable des entiers $b\geq2$ on
+a que presque tout $x$ est normal par rapport aux toutes bases $b$. On
+appelle un tel réel \textit{absolument normal}\index{absolument normal}.
+
+
+\section{Le théorème de recurrence de Khintchine}
+
+\section{Fractions continues et la transformation de Gauss}
+
+% ---------------------------------------------------------------------------
+
+% \chapter{Le théorème de Roth}
+
+% ---------------------------------------------------------------------------
+
 \chapter{Le théorème de Furstenberg et Sárközy}
 
 Dans ce chapitre nous allons démontrer le résultat suivant de Furstenberg et