"# Introduction à l'apprentissage automatique: TP5 - Exercice 3 \n",
"\n",
"<br>\n",
"\n",
"### Prédiction de la qualité de vins\n",
"\n",
"Le dataset suivant:\n",
"\n",
"https://www.openml.org/d/40691\n",
"\n",
"fournit la description de 1599 vins rouges: 12 mesures physico-chimiques ainsi qu'un critère qualitatif donné comme une note entre 3 et 8 (plus haute est la note, meilleur est le vin).\n",
"\n",
"Remarquez que les 12 caractéristiques doivent être normalisées.\n",
"\n",
"La cellule suivante charge les données, construit des bases d'apprentissage et de test, et normalise les caractéristiques.\n"
"- Certaines caractéristiques semblent corrélées (on pourrait le vérifier en traçant des graphiques et en calculant des coefficients de corrélation comme dans le cours d'analyse de données): il serait sans doute pertinent d'essayer de réduire la dimension des observations.\n",
"\n",
"- Nous allons envisager ce problème comme un problème de classification à 6 classes (les notes de 3 à 8). Néanmoins, il ne semblerait pas absurde de l'envisager comme un problème de régression.\n",
"\n",
"\n",
"<br>\n",
"\n",
"Proposez des prédicteurs de la qualité en fonction des 12 mesures physico-chimiques. Vous explorerez les machines à vecteurs supports et les perceptrons multicouches, dont vous fixerez les hyperparamètres par _grid search_ et validation croisée.\n",
"\n",
"<br>\n",
"\n",
"Comparez vos résultats à ceux reportés ici:\n",
"https://www.openml.org/t/146217\n",
"(en vous demandant si les valeurs sont bien comparables)"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": [
"# votre code ici:\n"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3 (ipykernel)",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.8.12"
}
},
"nbformat": 4,
"nbformat_minor": 4
}
%% Cell type:markdown id: tags:
# Introduction à l'apprentissage automatique: TP5 - Exercice 3
<br>
### Prédiction de la qualité de vins
Le dataset suivant:
https://www.openml.org/d/40691
fournit la description de 1599 vins rouges: 12 mesures physico-chimiques ainsi qu'un critère qualitatif donné comme une note entre 3 et 8 (plus haute est la note, meilleur est le vin).
Remarquez que les 12 caractéristiques doivent être normalisées.
La cellule suivante charge les données, construit des bases d'apprentissage et de test, et normalise les caractéristiques.
- Certaines caractéristiques semblent corrélées (on pourrait le vérifier en traçant des graphiques et en calculant des coefficients de corrélation comme dans le cours d'analyse de données): il serait sans doute pertinent d'essayer de réduire la dimension des observations.
- Nous allons envisager ce problème comme un problème de classification à 6 classes (les notes de 3 à 8). Néanmoins, il ne semblerait pas absurde de l'envisager comme un problème de régression.
<br>
Proposez des prédicteurs de la qualité en fonction des 12 mesures physico-chimiques. Vous explorerez les machines à vecteurs supports et les perceptrons multicouches, dont vous fixerez les hyperparamètres par _grid search_ et validation croisée.
<br>
Comparez vos résultats à ceux reportés ici:
https://www.openml.org/t/146217
(en vous demandant si les valeurs sont bien comparables)