Machine Learning : cas pratique
Introduction
Dans le chapitre Votre premier programme Python, nous avons parcouru les fondamentaux du langage de programmation Python associés à son environnement de développement (IDE) PyCharm. À présent, nous allons poursuivre notre apprentissage et plonger dans le domaine fascinant de la reconnaissance d’images et du machine learning (apprentissage automatique).
L’intelligence artificielle a le pouvoir de donner aux ordinateurs la capacité d’apprendre et de prendre des décisions à partir des données. La reconnaissance d’images est une des applications les plus captivantes de l’IA, permettant aux ordinateurs d’interpréter et d’analyser des images de la même manière que le font les humains. Dans ce chapitre, nous allons explorer cette discipline passionnante.
Notre voyage dans le monde de la reconnaissance d’images et du machine learning commencera par un cas pratique.
Nous travaillerons sur un cas d’utilisation courant où le machine learning est utilisé, à savoir « La prédiction du diabète à partir de données médicales ».
L’exercice sera réalisé pas à pas, en utilisant les connaissances que nous avons acquises dans les chapitres précédents, notamment en programmant en Python et en utilisant l’IDE PyCharm.
L’objectif...
Diabètes
Nous vous proposons ici de créer un petit programme avec le langage Python et son environnement de développement PyCharm. Bien entendu, libre à vous d’utiliser tout autre IDE de votre choix ; toutefois, par souci de cohérence avec le chapitre Votre premier programme Python, l’ensemble des éléments présents dans cet exercice dirigé sera basé sur cet environnement de développement.
Pas d’inquiétude à avoir pour les débutants, ce chapitre est accessible à chacun, que vous soyez novice en programmation ou non, l’idée étant de vous accompagner de bout en bout.
Nous vous guiderons ainsi à travers six étapes distinctes et un unique fichier de programmation dans le but de mener à bien votre première application de machine learning.
Pour ce faire, nous allons partir d’un cas réel nous permettant de bénéficier d’un modèle d’apprentissage à partir d’un jeu de données existant que nous allons importer. Ceci dans le but d’identifier les liens de causalité entre le diabète et un certain nombre de caractéristiques propres aux données importées, ce sera notre objectif.
Vous allez constater que ce jeu de données contient des informations sur 442 patients atteints de diabète, informations...
Diabètes : exercice appliqué
Prérequis
Les prérequis correspondent à ceux menés dans le chapitre Votre premier programme Python, avec notamment :
-
Python installé ;
-
environnement de développement PyCharm (ou tout autre éditeur de code).
Ces éléments sont indispensables à la réalisation de cet exercice.
Étape 1 : importation des bibliothèques nécessaires
Ouvrez PyCharm et créez un nouveau projet.
Création du projet dans PyCharm
Lors de cette étape, occupez-vous seulement de l’emplacement physique du TP sur votre poste de travail.
Emplacement physique de l’exercice
Comme indiqué en introduction de ce chapitre, nous vous proposons de travailler simplement, sur un unique document nommé par défaut à la création du projet : main.py. L’extension du fichier « .py » est propre au langage Python. PyCharm vous propose un exemple de code, que vous devrez effacer.
Arrivée à la création
Importez ensuite les bibliothèques nécessaires à la réalisation de l’exercice, notamment :
-
Numpy pour la manipulation des matrices et tableaux ;
-
Pandas pour l’analyse des données ;
-
Scikit-learn pour l’apprentissage automatique.
Avec cela, vous serez paré à la réalisation du programme.
Insérez le code source suivant dans le fichier main.py de votre éditeur Pycharm :
import numpy as np
import pandas as pd
from sklearn.datasets import load_diabetes
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, precision_score,
recall_score, f1_score
Il est possible que l’import génère quelques warnings. Au besoin, le passage de votre souris sur la ligne d’import posant problème permettra d’installer la ou les librairies manquantes.
Install Package : Unsolved reference
Une fois tout cela OK, vous devriez bénéficier d’un affichage clair dans votre fichier main.py :
Install package OK
Étape 2 : chargement des données
La seconde étape consiste à charger notre fameux jeu de données "diabètes"...
Conclusion
À travers un exercice pratique sur la prédiction du diabète, nous avons appliqué les connaissances que nous avons acquises dans le chapitre précédent Votre premier programme Python, sections Installation de Python et Installation de PyCharm, pour construire un modèle de machine learning.
Nous avons pu observer de façon simple comment les concepts de programmation que nous avons explorés, tels que la manipulation de données, la création de fonctions et la compréhension des structures conditionnelles, sont directement applicables à des problèmes réels et complexes comme la reconnaissance d’images.
L’exercice nous a permis d’appréhender les différentes étapes du processus de machine learning, de la collecte et la préparation des données à la construction et l’évaluation du modèle. Nous avons pu expérimenter l’impact des choix d’algorithmes et des paramètres sur les performances du modèle, ce qui souligne l’importance de l’expérimentation et de l’itération dans le domaine du machine learning.
À travers cette expérience, vous avez pu vous familiariser avec la manière dont l’intelligence artificielle peut être utilisée pour résoudre des problèmes concrets et apporter...