Avant-propos
Introduction générale
L’intelligence artificielle est un sujet aussi vieux que l’informatique, mais qui rencontre un succès fulgurant ces dernières années.
Aujourd’hui, l’intelligence artificielle interprète des radiographies mieux que les médecins, elle traduit des textes en différentes langues, elle reconnaît les personnes et les objets sur les images, elle joue et gagne à des jeux complexes comme le Go ou le jeu d’échecs, elle conduit des voitures, elle compose des mélodies, elle peint des tableaux, etc. Cette intelligence artificielle est de plus en plus présente dans notre vie de tous les jours.
Les technologies telles que le traitement automatique du langage naturel, la reconnaissance vocale, la reconnaissance d’objets dans les images, l’analyse des sentiments exprimés via un simple message ou exprimés sur un visage dans une photo sont toutes des technologies qui tendent à humaniser l’interface homme-machine, voire à doter la machine d’un caractère plus au moins semblable au caractère humain.
Lors de l’apparition d’Internet et des moteurs de recherche, dont Google principalement, les utilisateurs ont dû adapter leur manière de s’exprimer pour retrouver les informations qui les intéressent. À l’époque, les utilisateurs saisissaient des requêtes telles que : "comment changer une roue de voiture Peugeot 306 ?"
Aujourd’hui, la même personne dira juste "changer roue 306" et le moteur de recherche fera le reste ! Grâce aux évolutions technologiques fulgurantes de ces dernières années, l’utilisateur est invité à utiliser son propre langage naturel pour interagir avec la machine, c’est-à-dire que c’est la machine qui s’adapte à l’homme et non pas l’inverse.
Le résultat de la démocratisation de l’informatique et l’adoption massive d’Internet et des plateformes de Big Data ont permis l’émergence de cas d’usage de l’intelligence artificielle dans quasiment tous les domaines.
Plus récemment, l’essor de l’intelligence artificielle générative a marqué un tournant décisif dans le domaine. Ces modèles avancés, comme GPT-4 d’OpenAI, DALL-E ou plus récemment DeepSeek, sont capables de produire du texte, des images et même de la musique en s’appuyant sur d’énormes bases de données et des algorithmes d’apprentissage profond. Contrairement aux approches traditionnelles qui se limitent à la reconnaissance et à l’interprétation des données, l’IA générative crée du contenu original en simulant des processus cognitifs humains. Son impact est notable dans des secteurs comme la création artistique, la rédaction automatisée et même la programmation.
Des études récentes, notamment celles publiées par le MIT et Stanford, démontrent que ces nouvelles formes d’IA ne se contentent plus d’assister l’homme, mais participent activement à l’innovation et à la transformation numérique. Toutefois, ces avancées posent également des défis éthiques et légaux, notamment en matière de propriété intellectuelle et de biais algorithmiques, sujets qui suscitent un vif débat au sein de la communauté scientifique mais aussi au sein du grand public.
Vu leur nombre, l’énumération de toutes les applications concrètes de l’intelligence artificielle est impossible. Cependant, nous pouvons lister quelques cas d’usage très répandus :
-
La maintenance prédictive. Elle consiste à prédire avec une probabilité la date à laquelle un composant d’une machine va tomber en panne ! Par exemple, le centre de réparation des moteurs d’avions d’une compagnie aérienne sera capable de prédire la date à laquelle un avion tombera en panne. Cela va permettre d’anticiper les réparations et d’éviter les retards de vols. Dans ce cas, la maintenance prédictive est moins coûteuse que la maintenance corrective car il ne sera plus nécessaire de procéder à un changement périodique et systématique des pièces des moteurs d’avions. La maintenance prédictive peut être appliquée partout où des machines sont mises en œuvre pour réaliser des tâches (dans les usines, les centrales nucléaires, les machines à café, les ordinateurs, etc.).
-
La détection de fraudes. Il peut s’agir de détecter des transactions bancaires frauduleuses, des situations fiscales irrégulières, des intrusions aux systèmes d’information ou encore de fraudes à l’assurance.
-
Les moteurs de recommandation. Sur quasiment toutes les plateformes de partage multimédia et tous les sites marchands, nous retrouvons des systèmes de recommandation proposant du contenu ciblé en fonction des profils des visiteurs. Le but est d’accroître et d’optimiser les ventes. Par exemple :
-
L’Up-Selling et le Cross-Selling pour augmenter les marges et le nombre de produits vendus.
-
La recommandation de contenu, comme sur les plateformes YouTube et Netflix, en proposant des vidéos susceptibles d’intéresser les visiteurs.
-
L’optimisation combinatoire avec les algorithmes d’intelligence artificielle. Les algorithmes tels que les algorithmes génétiques ou les algorithmes d’optimisation par colonie de fourmis sont souvent utilisés pour optimiser des tâches impossibles à réaliser avec les algorithmes classiques basés sur des calculs de type force brute. Parmi les exemples les plus courants, nous pouvons citer :
-
L’optimisation des tournées de véhicules. Par exemple, une entreprise qui fait intervenir tous les jours des agents sur le terrain pour effectuer des livraisons et/ou des réparations aimerait minimiser les distances parcourues par ses agents.
-
L’optimisation des plannings des infirmiers et des médecins dans les hôpitaux.
-
L’optimisation des chaînes de fabrication dans les usines.
-
L’optimisation du placement des assets. Par exemple, les entreprises de télécommunication cherchent à utiliser un minimum d’antennes tout en couvrant un maximum d’espace géographique et en minimisant les interférences entre toutes ces antennes.
-
Les services cognitifs. L’arrivée des plateformes cloud et Big Data a été une aubaine pour le développement de multiples services cognitifs utilisables dans différents domaines et secteurs d’activité. Parmi les services cognitifs les plus répandus :
-
La vision par ordinateur telle que la détection de formes dans les images, la détection et la reconnaissance des visages.
-
La reconversion de la voix vers le texte, la synthèse et l’identification vocale.
-
Le traitement automatique du langage naturel qui est utilisé pour comprendre et générer du texte.
-
Les assistants virtuels. Les chatbots profitent grandement du développement des services cognitifs mais surtout de l’IA générative. Ces assistants virtuels bouleversent de façon significative la gestion de la relation client.
Les cas d’usage de l’intelligence artificielle ne cessent d’augmenter et il n’y a quasiment pas un jour qui passe sans que de nouvelles applications voient le jour, surtout avec l’arrivée de l’IA générative ! En effet, avec cette dernière, les cas d’usage de l’IA...
Pourquoi ce livre ?
Ce livre est une simple tentative de réponse aux questions et aux constatations telles que :
-
Je suis en reconversion professionnelle, comment m’initier au domaine du Machine Learning ?
-
Je débute ma thèse doctorale dans le domaine de l’apprentissage automatique et je souhaite pratiquer les algorithmes du Machine Learning via des exemples concrets.
-
Je souhaite bien démarrer en Machine Learning, mais je ne sais pas par où commencer ! Quelles sont alors les compétences nécessaires pour devenir Data Scientist ?
-
Quels sont les livres qui pourront m’aider pour apprendre le Machine Learning ?
Évidemment, il est très difficile d’apporter une réponse qui soit tout à fait satisfaisante à ces questions. Néanmoins, ce livre a été rédigé dans l’optique d’apporter éventuellement un début de réponse à ces interrogations pour ainsi aider un débutant en Machine Learning à acquérir quelques compétences fondamentales et pratiques pour bien commencer à travailler dans la Data Science.
Il existe plusieurs livres intéressants sur le sujet du Machine Learning. En revanche, le lecteur novice est souvent confronté à la multiplicité des compétences requises et préalables pour une compréhension profonde des concepts qui y sont abordés.
En effet, pour acquérir une compréhension approfondie et pouvoir développer des applications dans le domaine de la Data Science, il est nécessaire d’avoir des compétences sur les cinq axes suivants :
1. Maîtriser un langage de programmation tel que le langage R ou le langage Python.
2. Avoir des connaissances avancées dans le domaine des statistiques, notamment dans les statistiques descriptives et les statistiques inférentielles.
3. Comprendre le mécanisme de fonctionnement des algorithmes tels que les algorithmes de régression linéaire, les algorithmes de Random Forest, les algorithmes comme...
À qui s’adresse ce livre ?
Ce livre s’adresse à toute personne souhaitant acquérir des connaissances approfondies dans le domaine du Machine Learning, mais également à toute personne désireuse de s’initier au langage Python et aux statistiques descriptives et inférentielles.
Parmi les profils de lecteurs qui peuvent trouver un intérêt dans ce livre, nous pouvons citer :
-
Les étudiants dans le domaine de l’intelligence artificielle et en particulier les étudiants dans le domaine de la Data Science. Ces lecteurs trouveront dans ce livre des explications approfondies relatives aux notions du Machine Learning. Ils pourront également s’appuyer sur les chapitres Le langage Python, La bibliothèque NumPy, La bibliothèque Pandas et Travailler avec Jupyter afin d’acquérir des connaissances approfondies dans l’utilisation des outils techniques nécessaires à la pratique de la Data Science. Ces outils sont le langage Python avec ses bibliothèques NumPy et Pandas ainsi qu’une initiation à l’utilisation de l’environnement Jupyter. Outre ces connaissances techniques, des notions avancées sur les statistiques seront abordées et plusieurs cas pratiques seront expliqués tout au long de ce livre. À la suite de sa lecture, des connaissances avancées seront acquises...
Comment est organisé ce livre ?
Pour permettre d’acquérir progressivement les connaissances relatives aux concepts abordés, ce livre est organisé en cinq grandes parties comme suit :
1. La première partie (La Data Science - Concepts généraux) qui correspond au premier chapitre aborde les concepts les plus élémentaires de la Data Science. Ce chapitre permet d’avoir une vue globale de ce domaine et de comprendre les objectifs visés avec les algorithmes du Machine Learning. Ainsi, la lecture de cette première partie vise trois objectifs principaux. Le premier objectif est la compréhension des notions de base de la Data Science. Le deuxième objectif est d’acquérir la terminologie ou le jargon utilisé pour désigner certains concepts du Machine Learning. Le troisième objectif est de comprendre les métriques de performance qui permettent de mesurer l’efficacité des modèles.
2. La deuxième partie (Outils techniques de la Data Science - Python, NumPy, Pandas et Jupyter) est constituée des chapitres Le langage Python, La bibliothèque NumPy, La bibliothèque Pandas, et Travailler avec Jupyter. Cette partie vise l’acquisition de connaissances purement techniques nécessaires, entre autres, pour la pratique de la Data Science. En plus d’apprendre à programmer avec le langage Python, ces chapitres permettent aussi d’aborder les deux fameuses bibliothèques NumPy et Pandas. Également, cette partie permet au lecteur de découvrir l’environnement Jupyter, qui est l’un des environnements les plus utilisés par les Data Scientists.
3. La troisième partie (Les statistiques), qui est constituée de l’unique chapitre Statistiques, permet d’aborder des notions élémentaires et avancées sur les statistiques...
Comment lire ce livre ?
La lecture de ce livre peut bien sûr être adaptée en fonction du profil du lecteur. Pour le profil novice à la programmation et à la Data Science, l’auteur recommande de lire tous les chapitres dans l’ordre.
De manière générale, chaque chapitre peut être lu indépendamment des autres chapitres. Par exemple, un enseignant qui souhaite préparer un cours sur les algorithmes SVM ou un cours sur l’ACP peut lire directement le chapitre Support Vector Machine ou le chapitre Analyse en composantes principales, car l’auteur a fait des efforts particuliers afin de rendre la lecture individuelle des chapitres possible.
Dans tous les chapitres, l’auteur a essayé d’intégrer des exemples concrets afin de rendre palpables certains concepts théoriques qui sont réputés difficiles à comprendre sans la pratique.
Quels sont les prérequis pour la lecture de ce livre ?
Ce livre a été pensé dans l’optique d’être lu par un novice en programmation et en intelligence artificielle. Théoriquement, un niveau Terminal en mathématiques est suffisant afin de comprendre la plupart des notions abordées dans ce livre. Cependant, la compréhension des sections où sont abordées des formulations mathématiques de certains algorithmes nécessite d’avoir un niveau en mathématiques plus ou moins équivalent à un niveau Bac+3.
Qui est l’auteur ?
Après avoir obtenu le diplôme d’ingénieur en informatique à l’université Mouloud Mammeri à Tizi-Ouzou/Algérie et le diplôme de Master 2 en intelligence artificielle à l’université Paris V (René Descartes), Madjid Khichane a poursuivi ses études doctorales en Intelligence artificielle en collaboration avec la société IBM et l’université Claude Bernard (Lyon I). Cette thèse doctorale a donné naissance à des innovations algorithmiques dans le domaine de l’apprentissage par renforcement qui sont publiées dans des conférences internationales de premier niveau.
Parmi ces publications :
Conférence |
CPAIOR - 7th International Conference on Artificial Intelligence and Operations Research Techniques in Constraint Programming for Combinatorial Optimization Problems |
Titre |
Strong Combination of Ant Colony Optimization with Constraints Programming Optimization |
Auteurs |
Madjid Khichane, Patrick Albert, Christine Solnon |
Lieux/lien |
Italie| https://link.springer.com/book/10.1007/978-3-642-13520-0 |
Conférence |
Lion 3 Learnig and Intelligent OptimizatioN |
Titre |
An ACO-based Reactive Framework for Ant Colony Optimization: First Experiments on Constraint Satisfaction Problems |
Auteurs |
Madjid Khichane, Patrick Albert, Christine Solnon |
Lien |
Conférence |
ANTs 2008 - Sixth International Conference on Ant Colony Optimization and Swarm Intelligence |
Titre |
Integration... |
Remerciements
La rédaction de cet ouvrage a été une aventure aussi excitante qu’enrichissante. Mais sans doute n’y serais-je pas parvenu sans l’aide de mes proches.
Je remercie mon épouse et mon papa pour leurs encouragements, leurs relectures et leurs corrections. Un grand merci pour mes filles Séléna et Alicia pour leur soutien, chacune à sa façon. Je remercie ma mère et mon père, mes frères et ma sœur pour leurs encouragements incessants tout au long de mon parcours.
Merci à Patrick Albert d’avoir accepté de préfacer ce livre, mais surtout un grand merci à lui et à Christine Solnon pour m’avoir ouvert la porte du monde de l’intelligence artificielle lorsqu’en 2007 ils ont accepté ma candidature pour ce stage sur l’optimisation combinatoire avec les colonies de fourmis.
Pour ne risquer d’oublier personne, je remercie tous ceux qui ont contribué à ce livre soit par leurs remarques et relectures, soit par nos échanges sur le sujet de l’intelligence artificielle.
Je tiens aussi à remercier l’équipe des Éditions ENI pour leur patience, leur écoute attentive, leur compréhension, leur soutien et leurs encouragements durant toute la durée de la rédaction de ce livre. Un grand merci à Julie Potier, Juliette Py et Jérôme...