Blog ENI : Toute la veille numérique !
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
  1. Livres et vidéos
  2. Conception d’une base de données
  3. Glossaire
Extrait - Conception d’une base de données De l’analyse à la mise en œuvre
Extraits du livre
Conception d’une base de données De l’analyse à la mise en œuvre Revenir à la page d'achat du livre

Glossaire

Introduction

Dans ce glossaire se trouvent les différents termes définis tout au long du livre, classés par ordre alphabétique.

Administrateur de bases de données : l’administrateur de base de données (ou DBA comme on l’appelle formellement en raison de sa traduction en anglais, Database Administrator) a la responsabilité principale de s’assurer que les bases de données qu’il gère, ainsi que leurs systèmes de gestion de bases de données, sont dans un état optimal à tout moment.

Analyse des besoins : l’analyse des besoins implique l’identification des données nécessaires, leur structure, leur volume, et leurs interactions les unes avec les autres. Cette analyse guide la création d’un modèle conceptuel de données, qui définit les entités, les relations et les attributs.

Analyste de données : rôle de la science de données qui a comme objectifs l’extraction de données, la mise en place des indicateurs et la génération de rapports pour analyser les données d’une organisation.

Architecte de données : ce rôle est responsable de la conception de bases de données dans sa gamme la plus large, comme la modélisation logique des bases de données, l’analyse des besoins pour la mise en place d’une architecture serveur, la création d’un cadre de gestion de bases de données et l’analyse de risques, entre autres.

Attribut : les attributs sont les détails dont nous voulons que notre entité dispose. Chacun des attributs que nous allons définir dans les entités sera composé de données que nous voulons stocker pour une entité spécifique.

Base de données : c’est un système informatique permettant de stocker une grande quantité de données liées et structurées.

Base de données transactionnelle : nous pourrions dire que la principale caractéristique de ce type de base de données est qu’elle reçoit un grand nombre de transactions. En d’autres termes, il existe un nombre important d’utilisateurs qui effectuent des opérations plus ou moins lourdes par rapport à l’usage de la base de données.

Cardinalité : la cardinalité est le type de relation entre les attributs de deux entités.

Clé étrangère : c’est un attribut (ou ensemble d’attributs) qui fait référence à la clé primaire d’une autre entité.

Clé primaire : elle détermine quel est l’index de l’entité, de sorte que l’attribut (ou l’ensemble d’attributs) défini comme clé primaire aura une série de propriétés, dont les principales sont les suivantes :

  • La clé primaire est unique.

  • La clé primaire n’accepte pas les valeurs nulles.

  • Une clé primaire peut être composée de plusieurs champs.

Concurrence : garantir que différents utilisateurs qui effectuent des opérations sur la base de données en même temps puissent les effectuer de manière sûre et efficace.

Datamart : il s’agit d’un type de base de données qui, à partir d’un entrepôt de données ou d’un lac de données, regroupe les données liées à un sous-ensemble spécifique d’un point de vue fonctionnel.

Data Lake : voir Lac de données.

Data Warehouse : voir Entrepôt de données.

DBA : voir Administrateur de bases de données.

DBO : voir Opérateur de bases de données.

Développeur de bases de données : c’est un développeur spécialisé dans l’un des langages de programmation intégrés au moteur de base de données, tel que PL/SQL pour Oracle.

Diagramme Entité-Relation : représentation graphique qui montre les entités (tables) et les relations entre elles. Par exemple, dans un diagramme ER, nous pouvons montrer comment les tables Client et Commande sont liées via une intégrité référentielle.

Disponibilité : une base de données doit être disponible le plus longtemps possible. Une disponibilité de 100 % du temps n’est pas réaliste, mais plus on se rapproche de cette valeur, plus notre base de données s’améliore en termes de disponibilité.

Entité : une entité est une chose ou une personne dans le monde réel. Il peut s’agir d’un objet, comme un étudiant, mais aussi d’un concept abstrait, comme grade.

Entrepôt de données : les entrepôts de données, ou Data Warehouses en anglais, sont des bases de données d’une taille considérablement plus importante par rapport aux bases de données transactionnelles. Ses performances sont inférieures à celles d’une base de données transactionnelle, mais le nombre d’utilisateurs qui l’utilisent est beaucoup plus réduit.

ELT : ELT, qui signifie en anglais Extract, Load and Transform, nous rappelle l’ETL que nous avons évoqué dans le Data Warehouse. La différence est que dans le cas du Data Lake, nous extrayons les données d’une source de données, les insérons dans la base de données dont nous parlons, puis les transformons. Cette transformation pourrait consister, par exemple, à adapter les données pour alimenter différents entrepôts de données, à des fins statistiques, ou à croiser des données entre différentes sources.

ETL : ETL signifie en anglais Extract, Transform and Load, c’est-à-dire Extraire, Transformer et Charger. C’est un logiciel dont l’objectif est d’extraire les données d’une source de données (comme une base de données transactionnelle en production), d’y effectuer une série de transformations et d’écrire dans la base de données de destination, notre entrepôt de données.

Formes normales : nous pouvons définir les formes normales comme un moyen de standardiser nos bases de données, afin que nous puissions accéder à nos informations de manière plus optimale en fonction de nos objectifs.

Fuzzy search : recherches floues, utilisées dans la recherche de chaînes de texte qui, dans certains cas, peuvent être incomplètes.

IBM Db2 : Db2 est une famille de produits de gestion de bases de données développés par IBM. Il est utilisé dans divers environnements professionnels et offre un large éventail de fonctionnalités, notamment la gestion des données en temps réel et des analyses avancées.

Ingénieur de données : l’ingénieur de données (Data Engineer en anglais) a un rôle plus technique au sein de la data science, son rôle est plus proche de la machine que des utilisateurs. Nous pouvons dire que l’ingénieur de données est chargé de mettre en place les meilleures solutions pour résoudre un problème, améliorer un projet ou trouver les outils pour atteindre un objectif de la manière la plus efficace possible.

ITIL : ITIL (Information Technology Infrastructure Library) est une méthodologie qui définit une série de concepts et de bonnes pratiques pour améliorer l’organisation d’une entreprise et ainsi améliorer son efficacité.

La première forme normale (1NF) : la première des formes normales, qui vérifie une série de paramètres. Parmi eux, les attributs sont atomiques et la table contient une clé primaire unique.

La deuxième forme normale (2NF) : un bon indicateur pour vérifier si notre base de données est dans la deuxième forme normale (2NF) est de vérifier qu’elle répond aux exigences de la première forme normale (1NF), et aussi que ses principaux attributs dépendent complètement de sa clé primaire, avec laquelle il n’y a pas de dépendances...