Blog ENI : Toute la veille numérique !
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
💥 Du 22 au 24 novembre : Accès 100% GRATUIT
à la Bibliothèque Numérique ENI. Je m'inscris !

Quelques éléments de linguistique et d'IA

Introduction

Le présent livre traite bien du traitement automatique du langage naturel, mais comme abordé dans le chapitre précédent, il s’agit d’une discipline qui se trouve à la rencontre de plusieurs autres disciplines, en particulier la linguistique et l’intelligence artificielle. Sans entrer dans les détails conceptuels de chacune de ces disciplines, il faut tout de même aborder ces deux domaines, ne serait-ce que pour préciser leur périmètre respectif d’une part, et pour évoquer le vocabulaire spécifique d’autre part, ce qui sera utile pour la suite.

La linguistique

1. Signifié et signifiant

La linguistique est la science qui étudie le langage. Elle l’étudie de manière descriptive, c’est-à-dire qu’elle étudie le langage tel qu’il est utilisé et non tel qu’il conviendrait qu’il soit utilisé selon diverses normes sociales ou académiques. Dans le cas opposé, ce serait une approche prescriptive qui se place plutôt dans le champ d’étude de la grammaire.

La linguistique, comme toute science, possède une histoire qui lui est propre, dont les débuts sont en général associés aux travaux de Ferdinand de Saussure dans les années 1910. Il est à l’origine des concepts respectifs de « signifiant » et de « signifié ».

Le signifiant est l’image d’un mot, autrement dit, le son émis quand il est prononcé, ou sa graphie dans une langue donnée.

Le signifié représente le concept véhiculé par le mot qui, lui, est indépendant de la langue.

Un signifiant peut bien avoir plusieurs signifiés qui lui sont associés, via des homophones (deux sens se prononçant de la même façon), ou des homographes (deux sens s’écrivant de la même façon). C’est une des nombreuses difficultés que doit surmonter le traitement automatique du langage naturel, qui doit alors être en capacité d’analyser le contexte pour déduire le signifié. Autre difficulté : le signifié lui-même, le concept véhiculé par le mot, peut lui aussi avoir plusieurs signifiants dans une même langue.

Prenons comme exemple la phrase suivante :

Des vers de terre écrivent des vers.

Dans cet exemple, le signifiant « vers » a deux signifiés différents : l’animal et l’énoncé poétique. L’étymologie des mots étant différente, c’est une homonymie. Si un signifiant possède plusieurs signifiés, il est dit polysémique (par exemple, le temps qu’il fait, le temps qui passe, le temps rythmique), et s’il n’en possède qu’un, il est monosémique. Lorsque plusieurs signifiants...

L’intelligence artificielle et l’apprentissage automatique

1. Introduction

L’intelligence artificielle est un domaine de l’informatique qui se concentre sur la création de machines capables de simuler l’intelligence humaine. L’objectif de l’IA est de créer des machines qui peuvent effectuer des tâches que seuls des humains pouvaient auparavant effectuer, telles que la reconnaissance de la parole, la traduction automatique, la reconnaissance d’images, la prise de décision et la résolution de problèmes complexes.

2. Apprentissage automatique

L’un des principaux sous-domaines de l’intelligence artificielle est l’apprentissage automatique (Machine Learning). C’est un processus qui permet à une machine d’apprendre à partir de données et d’améliorer ses performances sans être explicitement programmée. En d’autres termes, un algorithme d’apprentissage automatique peut trouver des modèles dans les données et utiliser ces modèles pour prendre des décisions ou effectuer des prédictions.

3. Apprentissage profond

L’apprentissage profond (Deep Learning) est une sous-branche de l’apprentissage automatique qui se concentre sur l’utilisation de réseaux de neurones artificiels. Les réseaux de neurones artificiels sont des modèles mathématiques qui sont conçus pour imiter le fonctionnement du cerveau humain. Les réseaux de neurones sont composés de nombreuses couches de neurones qui sont connectées les unes aux autres. Chaque couche...

Conclusion

Le présent chapitre a permis de défricher les deux disciplines que sont la linguistique d’une part et l’intelligence artificielle (l’apprentissage automatique notamment) d’autre part. Cela nous permet d’avoir le socle nécessaire pour aborder le chapitre suivant, ciblant spécifiquement le traitement automatique du langage naturel.