Blog ENI : Toute la veille numérique !
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
💥 Du 22 au 24 novembre : Accès 100% GRATUIT
à la Bibliothèque Numérique ENI. Je m'inscris !
  1. Livres et vidéos
  2. Modélisation décisionnelle - Concevoir la base de données pour les traitements OLAP

Modélisation décisionnelle Concevoir la base de données pour les traitements OLAP

Informations

Livraison possible dès le 26 novembre 2024
  • Livraison à partir de 0,01 €
  • Version en ligne offerte pendant 1 an
Livres rédigés par des auteurs francophones et imprimés à Nantes

Caractéristiques

  • Livre (broché) - 17 x 21 cm
  • ISBN : 978-2-409-00793-4
  • EAN : 9782409007934
  • Ref. ENI : DPMODEC

Informations

  • Consultable en ligne immédiatement après validation du paiement et pour une durée de 10 ans.
  • Version HTML
Livres rédigés par des auteurs francophones et imprimés à Nantes

Caractéristiques

  • HTML
  • ISBN : 978-2-409-00912-9
  • EAN : 9782409009129
  • Ref. ENI : LNDPMODEC
Ce livre a pour objectif de fournir au lecteur toutes les clés pour concevoir une base de données décisionnelle efficace, s'intégrant parfaitement à une solution OLAP et permettant également d'entrevoir des nouvelles possibilités dans la manipulation de la donnée. Il s'adresse à un public ayant déjà des connaissances en bases de données. La connaissance des progiciels décisionnels est un plus mais n'est...
Consulter des extraits du livre en ligne Aperçu du livre papier
  • Niveau Initié à Confirmé
  • Nombre de pages 392 pages
  • Parution mai 2017
  • Niveau Initié à Confirmé
  • Parution mai 2017
Ce livre a pour objectif de fournir au lecteur toutes les clés pour concevoir une base de données décisionnelle efficace, s'intégrant parfaitement à une solution OLAP et permettant également d'entrevoir des nouvelles possibilités dans la manipulation de la donnée. Il s'adresse à un public ayant déjà des connaissances en bases de données. La connaissance des progiciels décisionnels est un plus mais n'est pas indispensable.

L'auteur suit un fil conducteur pour la conception d'un modèle de données et répond aux questions que se posera naturellement le lecteur au fur et à mesure de l'avancement, notamment sur les contraintes inhérentes à un choix de modélisation, et lui permet de trouver les compromis entre la théorie et la réalité du terrain.

À travers les premiers chapitres, le lecteur est invité à repenser et réorganiser la donnée technique autour d'une vision objet, la transformant ainsi en une véritable ressource. Les chapitres qui suivent lui permettent de saisir et de mettre des noms sur les concepts de modélisation propres au décisionnel (dimension, cube, langage, modèle...). La suite du livre permet au lecteur de savoir identifier et formaliser un besoin pour réussir à le transposer dans cette architecture si spéciale mais si puissante. Enfin, le lecteur apprendra à enrichir et optimiser le modèle créé.


Les chapitres du livre :
Avant-propos – Aborder le décisionnel – Repenser la donnée – Comprendre les spécificités du décisionnel – Identifier le projet – Concevoir le modèle – Historiser les données – Enrichir le modèle – Charger les données – Optimiser le modèle – Glossaire



Quizinclus dans
la version en ligne !
  • Testez vos connaissances à l'issue de chaque chapitre
  • Validez vos acquis
Avant-propos
  1. But de l'ouvrage
  2. De multiples concepts et quelques outils
    1. 1. Une modélisation indispensable et des outilsutiles
    2. 2. Un concept, de multiples modèles
  3. Rapports versus décisionnel
  4. Le quiproquo du Big Data
  5. Utilisateurs visés
  6. À propos du contenu
    1. 1. Technologies utilisées
    2. 2. Code couleur pour les schémas
Aborder le décisionnel
  1. Quid des termes décisionnels
    1. 1. De nombreux termes pour de nombreux concepts
    2. 2. Détails par catégorie
      1. a. Le projet : décisionnel, aide à ladécision ou la Business Intelligence
      2. b. Le système d’information : SID ou systèmed’information décisionnel
      3. c. Les données : base de données décisionnellerelationnelle, entrepôt de données et magasinde données
      4. d. La modélisation spécifique : basede données multidimensionnelle, OLAP, cubes
      5. e. Le chargement des données : ETL, intégration
      6. f. La restitution de la donnée : reporting,restitution, rapports, états, tableaux de bord, analyse,reporting ad hoc
    3. 3. Synthèse
  2. La justification du décisionnel
    1. 1. Des données et un besoin déjà présents
      1. a. Un besoin analytique
      2. b. Bien qualifier ce besoin
    2. 2. La réponse à un besoin métier
    3. 3. Une nécessité technique
    4. 4. Une nécessaire historisation
    5. 5. Nécessaire mais dispensable
  3. Mise en œuvre du projet
    1. 1. Les étapes
    2. 2. Découper le projet
  4. Identification du besoin
    1. 1. Identifier les utilisateurs cibles
    2. 2. Reprise de l’existant
      1. a. Reprise en l’état
      2. b. Identification des éléments clés
    3. 3. Demandes récurrentes
    4. 4. Identification des nouveaux besoins
    5. 5. Formaliser le besoin
      1. a. Matrice des besoins
      2. b. Détails complémentaires
    6. 6. La réalité
Repenser la donnée
  1. De la technique au métier
  2. Des "applications" aux "objets"
  3. De l'événement à la période
  4. Du transactionnel à l'analyse
  5. De l'exhaustivité à la simplicité
Comprendre les spécificités du décisionnel
  1. Le multidimensionnel : hiérarchiser la donnée
    1. 1. Les dimensions
    2. 2. Les cubes
    3. 3. Densité d’un cube
    4. 4. Les technologies de cubes
    5. 5. L’interaction avec le datawarehouse
    6. 6. Un langage spécifique : le MDX
    7. 7. Les modes de stockage
      1. a. Différents modes de stockage
      2. b. MOLAP
      3. c. ROLAP
      4. d. HOLAP
      5. e. Synthèse et choix
      6. f. Autres technologies
  2. Les fondamentaux de la base de données relationnelle
    1. 1. Le rôle de la base de données relationnelle
    2. 2. La dénormalisation
      1. a. Principe
      2. b. Dénormaliser les référentiels
      3. c. Dénormaliser les transactions
    3. 3. Pourquoi ne pas tout dénormaliser ?
    4. 4. Les modèles de données
      1. a. Dimensions versus référentiels
      2. b. Modèle en étoile
      3. c. Modèle en flocon
      4. d. Choix du modèle
      5. e. Modèle en galaxie ou constellation
Identifier le projet
  1. Entrepôts et magasins de données
    1. 1. Deux éléments distincts
    2. 2. Identification des caractéristiques
  2. Méthodologies de conception
    1. 1. Inmon : de l’entrepôt aux magasins
    2. 2. Kimball : des magasins à l’entrepôt
    3. 3. Une même vision cible
    4. 4. Choisir une méthode et Middle-Out
    5. 5. Le piège de la technique
  3. Formaliser l’entrepôt et les magasins de données
    1. 1. Les différents rôles de l’entrepôtde données
    2. 2. Les multiples concepts du magasin de données
      1. a. Les limites de la définition de base
      2. b. Le magasin de données comme nécessité technique
      3. c. Ordonnancement avec l’entrepôt
      4. d. Cardinalités entre datamarts et restitutions
  4. La base de données opérationnelle
    1. 1. L’ODS
    2. 2. La Staging Area ou Landing Zone
  5. Identifier les contraintes
    1. 1. Avant-propos
    2. 2. Contraintes technologiques
      1. a. Processus de choix des technologies
      2. b. Choix d’une solution pour la modélisation de la base de données relationnelle
      3. c. Choix d’une solution pour la modélisationdes cubes
    3. 3. Contraintes techniques
      1. a. Accès aux données
      2. b. Espace disque
      3. c. Exploitation
    4. 4. Contraintes projet
      1. a. Attentes utilisateurs
      2. b. Planning
      3. c. Normes et modélisation
      4. d. Sécurité
Concevoir le modèle
  1. Identifier les étoiles
    1. 1. L’importance des étoiles
    2. 2. Structuration ascendante
    3. 3. Identifier un fait
  2. Formaliser une dimension
    1. 1. Dimension référentielle et dimensionde faits
    2. 2. Les hiérarchies
      1. a. Identifier une hiérarchie
      2. b. Construire une hiérarchie
      3. c. Ascendance unique
      4. d. Homogénéité des niveaux
      5. e. Profondeur limitée et prédéfinie
      6. f. Les éléments communs entre les branches
    3. 3. Dimension basée sur les faits
      1. a. Dans la base de données relationnelle
      2. b. Dans la base de données multidimensionnelle
      3. c. Alternatives à l’absence de référentiel
    4. 4. Structure d’une table de dimension
      1. a. Identifiants techniques
      2. b. Codes, libellés et attributs fonctionnels
      3. c. Structure des tables
    5. 5. Le cas particulier de la dimension temps
  3. Formaliser les indicateurs
    1. 1. Différents termes et différentsconcepts
    2. 2. Indicateur intensif et indicateur extensif
    3. 3. Indicateurs calculés simples
    4. 4. Indicateurs calculés complexes
  4. Identifier les données
    1. 1. Dans la base de données décisionnelle
    2. 2. Dans la base de données opérationnelle
  5. Formaliser la table de faits
    1. 1. La structure type d’une table de faits
    2. 2. Les sources des tables de faits
    3. 3. Consolidation de tables de faits
    4. 4. Contraintes techniques
    5. 5. La gestion des valeurs nulles
    6. 6. Granularité de la table de faits
      1. a. Finesse des données
      2. b. Impact sur la volumétrie
  6. Formaliser la table d'agrégats
    1. 1. Rôle et structure d’une table d’agrégats
    2. 2. Utilisation de filtres
    3. 3. Utilisation d’agrégats de dimension
      1. a. Méthodes et limites
      2. b. Impacts sur la granularité
    4. 4. Utilisation d’agrégats de faits
    5. 5. Suppression de dimension
    6. 6. Contraintes techniques
  7. Nommer les objets
  8. Schéma synthétique des flux et types d'objets
    1. 1. Entrepôt en flocon et magasins en étoile
    2. 2. Entrepôt en étoile et magasins en étoile
    3. 3. Entrepôt en flocon et magasins en flocon
Historiser les données
  1. Les raisons de l'historisation
  2. Historisation des dimensions
    1. 1. Une évolution de la réalité métier
    2. 2. Dimension à évolution lente
      1. a. Les méthodes courantes
      2. b. Ajout d’une nouvelle ligne
      3. c. Ajout d’une nouvelle colonne
    3. 3. Dimension à évolution rapide
    4. 4. Choix de la période
  3. Historisation des faits
    1. 1. Identification des faits
    2. 2. Problématique et historisation des faits
  4. Historiser ou corriger ?
    1. 1. Identification du contexte analytique de la donnée
    2. 2. Le temps des choix et concessions
  5. Initialisation d'un système historisé
    1. 1. Des données historiques mais non historisées
    2. 2. Utiliser le contexte initial du SID
    3. 3. Autres méthodes
  6. Durée d'historisation idéale
    1. 1. Entre contrainte technique et utilité métier
    2. 2. Historisation des indicateurs agrégés
  7. Remarques complémentaires
    1. 1. Reconsidérer le problème
    2. 2. Calcul sur une période
    3. 3. Impact sur la volumétrie
    4. 4. Dates d’effet, saisie et chargement
Enrichir le modèle
  1. Problématique de conception des objets
    1. 1. Limiter le découpage des objets
    2. 2. Les plages de dates dans les faits
      1. a. Périodes basiques
      2. b. Chevauchements de périodes
    3. 3. L’utilisation d’une mesure comme dimension
    4. 4. Les indicateurs distinctifs
    5. 5. Transformer un attribut en dimension
    6. 6. La relation many-to-many dans une dimension
      1. a. Présentation du problème
      2. b. Répartir les parents dans plusieurs hiérarchies
      3. c. Répartir les parents dans plusieurs dimensions
    7. 7. Diviser une étoile en plusieurs étoiles
      1. a. En enlevant une dimension
      2. b. En rajoutant une dimension
      3. c. Influence des données sources
  2. Problématiques de la dimension temps
    1. 1. Les valeurs par défaut sur la dimension temps
    2. 2. Les dimensions temps métier
    3. 3. L’utilisation parcimonieuse des dates
    4. 4. L’analyse sur les heures
  3. Problèmes de granularité des transactions reçues
    1. 1. Description du problème
    2. 2. Des données opérationnelles tropfines
    3. 3. Des données opérationnelles troplarges
    4. 4. Des données opérationnelles hétérogènes
  4. Problématiques des référentiels
    1. 1. Stratégies de rejet
    2. 2. Utilisation d’alias
    3. 3. Les référentiels non analytiques
    4. 4. Les référentiels autoalimentés
      1. a. Justification et création d’un référentielautoalimenté
      2. b. Regroupements et hiérarchies des référentielsautoalimentés
  5. Problématiques de correction des faits
    1. 1. Création d’un flux de correction
    2. 2. Corriger une mesure
    3. 3. Corriger une ventilation
Charger les données
  1. Le choix de la solution d'intégration
    1. 1. SQL versus ETL
    2. 2. Choix techniques
      1. a. Performances
      2. b. Fonctions avancées
      3. c. Formats de données
    3. 3. Une interface explicite
    4. 4. Compétences
    5. 5. Bilan
  2. Chargement des éléments du modèle
    1. 1. Les différents types de chargements utilisablesdans un SID
      1. a. Annule et Remplace
      2. b. Insertion ou Mise à jour (alias UPSERT)
      3. c. Insertion des modifications (alias INSERT)
    2. 2. Utilisation des types de chargements dans le SID
      1. a. Synthèse par flux
      2. b. L’effet boule de neige dans les flux transactionnels
      3. c. L’évolutivité du contexte
  3. Ordonnancement des éléments
    1. 1. Dépendances des objets
    2. 2. Compartimentage des objets
    3. 3. Fréquence d’intégration
  4. En dehors des phases d'exploitation
    1. 1. Chargement initial
    2. 2. Reprises de données
Optimiser le modèle
  1. Identifier les optimisations
  2. Optimisation de la base de données relationnelle
    1. 1. Utilisation des index
    2. 2. Utilisation des partitions
    3. 3. Types de colonnes
    4. 4. Utilisation des vues et tables temporaires
    5. 5. Suppression des contraintes
  3. Optimisation de l'utilisation du serveur ETL
Annexe
  1. Glossaire
Auteur : Thibault BOURCY

Thibault BOURCY

Ingénieur en informatique décisionnelle de l'École des Mines de Nantes, Thibault Bourcy a travaillé sur la mise en place de nombreux systèmes décisionnels pour des entreprises de transport, vente au détail, banques, assurances, télécoms ou encore des administrations publiques. Certifié sur plusieurs technologies de Business Intelligence, il transmet à travers les pages de ce livre toute son expertise technique enrichie de nombreux retours d'expérience.
En savoir plus

Nos nouveautés

voir plus