1. Livres & vidéos
  2. AWS
  3. Stockage cloud et migration de données avec AWS
Extrait - AWS Préparation à la certification Solutions Architect - Associate
Extraits du livre
AWS Préparation à la certification Solutions Architect - Associate Revenir à la page d'achat du livre

Stockage cloud et migration de données avec AWS

Prérequis et objectifs

1. Prérequis

Un compte AWS configuré est nécessaire pour aborder ce chapitre.

Des connaissances en lignes de commandes pour le cas pratique.

2. Objectifs

L’objectif est de se familiariser avec les différentes options de stockage disponibles dans AWS, y compris les solutions hybrides.

Ce chapitre explore les solutions de stockage sur AWS, couvrant leurs différents types, cas d’utilisation, caractéristiques, et stratégies d’intégration pour répondre aux exigences de performance, de scalabilité, et de coût. Vous apprendrez à concevoir des architectures de stockage adaptées à divers scénarios, allant du stockage hybride aux solutions cloud natives, en passant par la sauvegarde, le transfert de données et la gestion des cycles de vie des données.

3. Positionnement dans la certification AWS

Ce chapitre répond à l’objectif « Conception d’architectures hautement performantes », en particulier à l’énoncé de tâche : déterminer les solutions de stockage hautement performantes et/ou pouvant être mises à l’échelle. Les compétences et connaissances abordées incluent :

  • Les solutions de stockage hybride pour répondre aux exigences métiers.

  • Les services de stockage AWS adaptés...

Amazon S3

1. Introduction et concepts de base de S3

a. Présentation générale d’Amazon S3

images/02CE01.png

Amazon Simple Storage Service, communément appelé S3, a été le second service lancé par AWS en 2006. En tant que pierre angulaire de la suite de services AWS, S3 a révolutionné la façon dont les données sont stockées dans le cloud. Avant l’arrivée de S3, stocker et récupérer des données sur Internet pouvait être une tâche complexe et coûteuse. Cependant, avec l’introduction de S3, AWS a offert une solution de stockage d’objets simple, fiable et à un coût abordable. Aujourd’hui, S3 est largement utilisé par des entreprises de toutes tailles, allant des startups aux multinationales pour stocker une vaste gamme de données, des images de sites web aux sauvegardes d’entreprise en passant par les big data.

b. Architecture d’Amazon S3

Amazon S3 est un service managé basé sur une architecture distribuée qui garantit une haute disponibilité et une durabilité des données. Cette architecture repose sur plusieurs centres de données géographiquement répartis, ce qui permet de stocker et de répliquer les données de manière redondante pour assurer leur disponibilité même en cas de panne.

Un des avantages clés d’Amazon S3 est son modèle sans serveur (serverless). Cela signifie que les utilisateurs n’ont pas à se soucier de la gestion des serveurs sous-jacents : AWS prend en charge toute la complexité de l’infrastructure, y compris la répartition des charges, la réplication des données et la tolérance aux pannes.

Chaque bucket dans S3 est accessible via une URL unique, généralement sous la forme suivante :

http://[nom-du-bucket].s3.amazonaws.com/[clé-de-l’objet]

Cette URL permet d’interagir avec les objets stockés dans le bucket. Cependant, l’accès aux données est strictement contrôlé à l’aide de politiques d’accès et de listes de contrôle d’accès (ACL), garantissant que seules les personnes autorisées peuvent consulter ou modifier les objets.

Enfin, la gestion des ressources dans...

Solutions de stockage en bloc

1. Le stockage en bloc

Le stockage en bloc est un type de solution de stockage où les données sont découpées en blocs de taille fixe, chaque bloc étant identifié par une adresse unique. Ce modèle de stockage est particulièrement performant pour les applications nécessitant un accès rapide et constant aux données, comme les bases de données, les systèmes de fichiers, et les applications transactionnelles. Contrairement au stockage de fichiers, qui organise les données sous forme hiérarchique (dossiers et fichiers), le stockage en bloc se concentre sur la gestion directe des blocs de données bruts, ce qui offre une plus grande flexibilité dans l’accès et la gestion des données.

L’un des avantages clés du stockage en bloc réside dans sa faible latence et sa grande évolutivité. Chaque bloc peut être modifié indépendamment, ce qui permet des opérations d’écriture et de lecture rapides, même sur de grandes quantités de données. De plus, il est possible d’attacher des volumes de stockage en bloc à des instances de calcul pour offrir des performances de type disque local, tout en conservant la possibilité de détacher et rattacher ces volumes à d’autres instances.

Le stockage en bloc est largement utilisé dans les environnements cloud, où il est essentiel pour héberger des applications critiques et maintenir la persistance des données, même lorsque les instances de calcul sont arrêtées ou redémarrées. Dans AWS, les deux principales solutions de stockage en bloc sont Amazon EBS et Instance Store. Amazon EBS fournit un stockage persistant, tandis qu’Instance Store offre un stockage temporaire haute performance.

Dans cette section, nous allons explorer ces deux solutions en détail. Notez que nous verrons plus tard comment elles interagissent avec Amazon EC2, les serveurs virtuels d’AWS permettant d’exécuter des applications, puisque ce chapitre se concentre exclusivement sur les solutions de stockage en bloc.

2. Amazon EBS

a. Présentation d’Amazon EBS

images/02CE17.png

Amazon Elastic Block Store (Amazon EBS) est un service de stockage en bloc persistant conçu pour être...

Solutions de stockage de type fichier

1. Le stockage fichier

Le stockage en mode fichier est une méthode de stockage de données largement utilisée dans les systèmes informatiques, où les données sont organisées sous forme de fichiers dans une structure hiérarchique de répertoires. Chaque fichier est identifié par un chemin d’accès unique, ce qui le rend facile à localiser et à gérer.

Contrairement au stockage en bloc, qui divise les données en blocs, ou au stockage objet, où les données sont stockées avec des métadonnées dans un environnement plat, le stockage fichier est idéal pour des cas où une structure hiérarchique est nécessaire. Cela inclut les partages réseau, les environnements collaboratifs et les applications nécessitant des accès fréquents à des fichiers partagés, tels que les systèmes de gestion de contenu et les bases de données relationnelles.

Le stockage fichier est particulièrement adapté aux cas où plusieurs utilisateurs ou systèmes doivent accéder simultanément à des fichiers, avec des permissions et des contrôles d’accès spécifiques. Par exemple, les organisations utilisent souvent le stockage fichier pour centraliser leurs données d’équipe, comme des documents, des rapports ou des présentations, tout en offrant un contrôle granulaire sur qui peut lire, modifier ou supprimer ces fichiers.

Les solutions de stockage en mode fichier proposées par AWS, telles qu’Amazon Elastic File System (EFS) et Amazon FSx, permettent de gérer des volumes massifs de données tout en offrant des fonctionnalités avancées comme l’évolutivité automatique, la résilience et l’intégration avec d’autres services AWS. Ces solutions simplifient la gestion des infrastructures de stockage tout en répondant aux besoins variés des entreprises, qu’il s’agisse d’héberger des applications, de stocker des données collaboratives ou de gérer des charges de travail intensives.

2. Amazon Elastic File System

a. Présentation d’Amazon EFS

images/02CE22.png

Amazon Elastic File System (EFS) est un service...

Solutions hybrides et on-premise avec AWS

1. AWS Storage Gateway

images/02CE30.png

Amazon Storage Gateway est un service de stockage hybride qui permet aux entreprises d’étendre et de connecter de manière transparente leur infrastructure de stockage sur site au cloud AWS. En agissant comme un pont entre les environnements sur site et le cloud, Storage Gateway facilite le stockage sécurisé des données dans le cloud AWS pour la sauvegarde, l’archivage, la reprise après sinistre et le traitement des données. Ce service prend en charge différents types de gateways, chacun étant conçu pour des cas d’utilisation spécifiques, permettant ainsi une intégration flexible avec les applications et les processus d’affaires existants.

a. Types d’appliances

Une appliance, dans le contexte des solutions AWS Storage Gateway, désigne un dispositif matériel ou virtuel utilisé pour connecter les environnements locaux au cloud AWS de manière transparente. Elle agit comme une passerelle entre les applications locales et les services de stockage AWS, facilitant le transfert, la synchronisation et la sauvegarde des données. Grâce à cette passerelle, les entreprises peuvent exploiter les fonctionnalités avancées du cloud AWS tout en conservant leurs infrastructures existantes et les workflows habituels.

Les entreprises qui souhaitent adopter les solutions AWS Storage Gateway ont la possibilité de choisir parmi plusieurs types d’appliances selon leurs besoins spécifiques. AWS propose deux grandes catégories d’appliances :

  • Appliance virtuelle : l’appliance virtuelle est une machine virtuelle que les entreprises peuvent déployer sur leurs hyperviseurs existants, tels que VMware ESXi, Microsoft Hyper-V ou Linux KVM. Cette solution est flexible et économique, car elle utilise l’infrastructure informatique déjà en place sans nécessiter de nouveaux investissements matériels.

    Les étapes de déploiement consistent à télécharger un modèle d’appliance (fichier OVA ou OVF), à l’importer dans l’hyperviseur, puis à configurer la passerelle pour établir la connexion avec AWS. Une fois configurée, l’appliance virtuelle peut gérer les flux de données...

Services de gestion et de protection des données

1. AWS Transfer Family

a. Présentation d’AWS Transfer Family

images/02CE40.png

Amazon Transfer Family est un service entièrement managé qui permet le transfert sécurisé de fichiers vers et depuis les services de stockage AWS, tels qu’Amazon S3 et Amazon EFS, en utilisant des protocoles standards comme SFTP, FTPS et FTP. Ce service est conçu pour simplifier la migration et l’intégration des workflows de transfert de fichiers dans le cloud AWS, sans nécessiter de réécriture des applications existantes. En utilisant Transfer Family, les entreprises peuvent facilement migrer des systèmes de transfert de fichiers traditionnels vers AWS tout en bénéficiant des capacités de sécurité, de scalabilité et d’intégration avec d’autres services AWS.

b. Fonctionnalités principales

AWS Transfer Family offre un ensemble de fonctionnalités puissantes pour répondre aux besoins de transfert de fichiers des entreprises. Le service prend en charge les protocoles standards SFTP, FTPS et FTP, garantissant ainsi une compatibilité avec une large gamme d’applications existantes. Les fichiers transférés peuvent être stockés directement dans Amazon S3 ou Amazon EFS, offrant des options flexibles pour l’intégration avec d’autres services AWS.

L’authentification peut être configurée via AWS IAM, des fournisseurs d’identité externes (LDAP, Active Directory) ou même des bases de données personnalisées, garantissant un contrôle granulaire sur l’accès des utilisateurs. AWS Transfer Family s’intègre également avec Amazon CloudWatch et AWS CloudTrail pour permettre une surveillance et une traçabilité complètes des activités de transfert de fichiers. De plus, le service supporte des workflows automatisés pour traiter les fichiers après leur transfert, tels que le déplacement vers des dossiers spécifiques, le déclenchement de fonctions AWS Lambda, ou encore la mise à jour de bases de données.

c. Cas d’usage

AWS Transfer Family permet à une entreprise de gérer facilement des workflows impliquant des partenaires...

Migration de données

1. Introduction à la famille AWS Snow

La famille AWS Snow regroupe plusieurs solutions de transfert de données physiques conçues pour faciliter la migration de grandes quantités de données entre les environnements on-premise et les centres de données AWS. Ces solutions sont particulièrement utiles lorsque les transferts via Internet deviennent impraticables en raison de limitations de bande passante, de coûts élevés ou de délais inacceptables. 

Les appareils de la famille AWS Snow permettent d’effectuer des migrations de données de manière sécurisée, rapide et efficace, en éliminant les contraintes liées aux réseaux. Si un transfert de données prenait plus d’une semaine via une connexion réseau classique, il devient pertinent d’envisager l’utilisation des dispositifs Snowball, Snowcone ou Snowmobile.

Voici les étapes typiques d’un processus de migration avec AWS Snow. Tout d’abord, on commande les appareils Snow directement depuis la console AWS. Une fois la demande effectuée, les dispositifs Snow sont expédiés à l’adresse spécifiée, généralement le site de l’entreprise. Cette étape permet aux organisations de recevoir rapidement l’appareil adéquat pour débuter le transfert de données.

Ensuite, on installe le client Snowball ou l’outil AWS OpsHub sur les serveurs locaux. AWS OpsHub simplifie la gestion et la configuration des appareils, offrant une interface intuitive pour préparer l’appareil et initier le transfert de données. Une fois l’appareil configuré, on le connecte aux serveurs via les ports appropriés et on utilise le client ou OpsHub pour copier directement les fichiers vers l’appareil Snow. Ce processus garantit que les données sont transférées de manière sécurisée et rapide, sans nécessiter de connexion internet continue.

Une fois la copie des données terminée, on renvoie l’appareil à AWS en suivant les instructions d’expédition fournies. Le dispositif est ensuite acheminé vers le centre de données AWS adéquat, où les équipes AWS prennent en charge...

Cas pratiques French Bakery avec S3

Hébergement du site vitrine de l’entreprise French Bakery

L’entreprise French Bakery, nouvellement créée, souhaite établir une présence en ligne afin de présenter ses produits et attirer davantage de clients. Pour répondre à ce besoin, nous allons mettre en place un site vitrine statique hébergé sur Amazon S3.

Voici les étapes détaillées pour configurer et héberger le site de French Bakery sur un bucket S3 :

Étape 1 : Création du bucket S3

 Accédez au service S3 depuis la console AWS en le recherchant dans la barre de recherche.

images/02CE50.png

 Cliquez sur Create Bucket.

images/02CE51.png

 Saisissez un nom unique pour votre bucket. Dans mon cas, j’utilise mbounaceur-staticwebsite-s3. Assurez-vous que le nom que vous choisissez respecte les règles d’unicité globales de S3 et qu’il n’est pas déjà utilisé. Une fois le nom saisi, descendez tout en bas de la page et cliquez sur Create Bucket.

Vous pouvez également créer le bucket en ligne de commande avec la commande suivante :

aws s3 mb s3://mbounaceur-staticwebsite-s3 --region eu-west-1 

Étape 2 : Configuration du bucket S3

 Une fois le bucket crée, cliquez dessus pour accéder à ses détails.

images/02CE52.png

 Cliquez sur Upload pour ajouter les fichiers de votre site.

 Cliquez sur Add folder pour ajouter les dossiers js, css, et images. Vous pouvez retrouver tous les ressources nécessaires au bon déroulement de ce travail pratique à cette adresse : https://gitlab.com/mbounaceur/ENI-AWSAssociateArchitect/-/tree/main/S3/StaticWebsite...

Validation des acquis : questions/réponses

Si l’état de vos connaissances sur ce chapitre vous semble suffisant, répondez aux questions ci-après.

1. Questions

1 Une entreprise souhaite exécuter des charges de travail nécessitant une latence extrêmement faible et un accès direct à ses systèmes on-premise tout en utilisant les mêmes outils et services qu’AWS. L’infrastructure doit être flexible, capable de gérer des applications critiques et offrir une continuité avec les environnements cloud existants. Quels éléments techniques et opérationnels analyseriez-vous pour concevoir une solution qui réponde à ces exigences ?

2 Un client a besoin de partager une URL à un utilisateur pour une durée de trois jours. Quelle serait la meilleure solution ?

3 Une organisation souhaite étendre son infrastructure de stockage on-premise pour inclure une sauvegarde régulière des volumes de données vers AWS, tout en permettant aux applications locales de continuer à fonctionner sans interruption. Les données doivent être facilement restaurables en cas de défaillance du système local. Quels aspects techniques et opérationnels évalueriez-vous pour répondre à ces besoins ?

4 Une organisation souhaite renforcer la sécurité des données critiques stockées dans Amazon S3 en limitant les risques de suppressions accidentelles ou malveillantes, tout en respectant des exigences de conformité strictes. Quelles solutions ou mécanismes recommanderiez-vous pour répondre à ces besoins et garantir une gestion sécurisée des données ?

5 Comment une entreprise peut-elle étendre son infrastructure on-premise vers le cloud tout en conservant VMware et ses outils existants ?

6 Une entreprise souhaite déployer un stockage partagé entièrement managé basé sur le système de fichiers ONTAP de NetApp, reconnu pour ses fonctionnalités avancées telles que la déduplication, la compression, et la prise en charge multiprotocole (NFS, SMB, iSCSI). Quelle solution AWS utiliseriez-vous pour répondre à ce besoin et pourquoi ?

7 Un client veut archiver des données historiques...