Blog ENI : Toute la veille numérique !
🎁 Jusqu'au 25/12 : 1 commande de contenus en ligne
= 1 chance de gagner un cadeau*. Cliquez ici
🎁 Jusqu'au 31/12, recevez notre
offre d'abonnement à la Bibliothèque Numérique. Cliquez ici
  1. Livres et vidéos
  2. Business Intelligence : le recueil des besoins
  3. Techniques de modélisation
Extrait - Business Intelligence : le recueil des besoins La boîte à outils du business analyst
Extraits du livre
Business Intelligence : le recueil des besoins La boîte à outils du business analyst
1 avis
Revenir à la page d'achat du livre

Techniques de modélisation

Kimball

Ralph Kimball est considéré par beaucoup comme le père de la Business Intelligence. Il a théorisé dans le milieu des années 80 les concepts de base des données dimensionnelles. Cette approche dimensionnelle fait l’objet de nombreux ouvrages (dont plusieurs best sellers) dans ce domaine. Kimball est connu pour l’invention de la modélisation dimensionnelle (première activité du second chemin dans le schéma ci-dessous). Cela est assez réducteur. Il propose en effet une approche où les différents aspects de la construction d’un entrepôt de données sont intégrés. Ce chapitre n’a évidemment pas pour ambition de résumer les pratiques de modélisation, mais de les relier avec le sujet de ce livre. Après une description succincte des étapes, et des besoins à collecter pour réaliser chacune d’entre elles, nous verrons quand l’utiliser.

Lors de l’étape de définition des besoins fonctionnels, Kimball propose une approche à base d’interviews des parties prenantes fonctionnelles et techniques. Celle-ci est décrite dans le chapitre Activités de recueil des besoins - Interviews.

Dans le cycle de vie du projet vu par Kimball, après une étape de planification et de recueil des besoins, les activités se divisent en trois pistes. Elles se rejoindront pour les phases de déploiement avant de se poursuivre avec la maintenance et les améliorations.

images/CH7V1.png

Le diagramme du cycle de vie du projet selon Kimball

1. Le cycle de vie des données

Il existe plusieurs activités : la modélisation dimensionnelle, le design physique, et enfin le design et le développement de l’ETL.

Concernant la modélisation dimensionnelle, il existe des livres entiers sur le sujet. Dans les grandes lignes, Kimball établit cinq étapes pour définir un entrepôt de données :

  • Identifier un processus métier à analyser : il s’agit ici de définir le périmètre fonctionnel. Le processus métier qui sera capturé, les activités de ce processus et les besoins en matière de reporting, la définition des métriques qu’il est souhaitable d’utiliser....

Data Vault

Data Vault est une approche de modélisation de données. Elle sert à définir les tables et les relations dans l’entrepôt de données. Celle de Kimball est basée sur la modélisation des processus, ceux-ci sont relativement volatiles. Ces changements demanderont alors de la maintenance. Data Vault cherche à modéliser les concepts métier, il y aura en conséquence beaucoup moins de changements. En effet, les concepts ne sont pas la description de la manière de procéder, mais des éléments de base pour penser le business et communiquer. Un changement de concept relève alors d’une remise en cause complète du business. 

La 3NF (troisième forme normale) est une modélisation utilisée pour les systèmes opérationnels (ERP, CRM, Ventes, Comptabilité, Finance…). Elle est optimisée pour un accès rapide à un petit nombre de données en écriture ou en lecture.

La modélisation dimensionnelle (de type Kimball) est quant à elle utilisée pour la construction des datamarts. Elle est optimisée pour l’interrogation (lecture) d’un grand volume de données.

La modélisation Data Vault est utilisée dans l’EDW (Enterprise Data Warehouse), elle optimise l’intégration, l’historisation et l’agilité du système.

Le concept sous-jacent est la "décomposition unifiée". Décomposons la "décomposition unifiée" : d’un côté on cherchera à découpler...