Le support et l'analyse opérationnelle
Présentation générale
Le support et l’analyse opérationnelle va intervenir uniquement lors de la phase d’exploitation des services, qui représente la phase de vie des services, c’est-à-dire ce que l’on appelle communément la production informatique avec aussi toute l’activité support, maintenance corrective, voire évolutive. Les Anglo-Saxons appellent cette phase les opérations, "Service Operations". Cette phase démarre dès la mise en service officielle d’un service, à la fin de la période d’acceptation du service en mode régulier (VSR, vérification du service régulier) ou à la fin de période de garantie, et se termine lors du retrait du service.
Malheureusement, dans cette phase, on va peut-être mettre en évidence des erreurs de conception ou de réalisation sur le logiciel ou le service lui-même, ou bien des pannes du matériel informatique vont survenir. Il faudra donc prendre les actions nécessaires pour remédier à tout cela pour atteindre l’efficacité du service. Ensuite, on regardera à améliorer la productivité des services afin d’augmenter l’efficience de l’informatique, c’est-à-dire l’optimisation des coûts par rapport à un certain...
La pratique supervision et gestion des événements
1. Généralités
a. Définitions
Événement
Un événement est un fait détectable qui arrive sur le système d’information et qui a une signification pour la gestion de l’infrastructure ou sur la fourniture des services offerts.
Un événement est aussi un changement d’état d’un ou plusieurs composants de l’infrastructure détecté par un outil.
Un événement n’existe que s’il est détecté par un outil de supervision, d’exploitation ou de pilotage. Sans outillage, on ne gère pas d’événement. Sans supervision, il n’y a pas de gestion d’événements. Un événement est une notion interne à l’informatique et, dans la plupart des cas, il ne sera pas visible par les utilisateurs. Un événement ne dégrade pas la qualité du service offert, si c’est le cas, on parlera non plus d’événement, mais d’incident.
Types d’événements
Il existe trois types d’événements : normal, avertissement et exception.
-
Normal : cet événement va témoigner d’un fonctionnement normal (par exemple début ou fin d’activité, début et fin de transaction) et/ou d’un changement d’état (par exemple, sous ou hors tension). On peut rapidement être submergé par un nombre important d’événements. On décide la plupart du temps de les ignorer, car le volume est considérable. A minima, on peut regarder la volumétrie d’un certain nombre d’événements normaux.
-
Avertissement (warning en anglais) : cet événement est inhabituel et "non anormal". Souvent, un avertissement montre la progression d’une activité (par exemple, l’approche ou le franchissement d’un seuil). Un avertissement est souvent lié à un pic d’activité (ou, à l’inverse, à un arrêt d’activité). Tout fonctionne correctement, mais cette situation demande une surveillance, voire une action de prévention.
-
Exception : cet événement...
La pratique gestion des incidents
1. Généralités
Dans cette section seront traitées uniquement les activités de la pratique gestion des incidents dans le cadre du support opérationnel. Dans le chapitre précédent, nous avons abordé la gestion des incidents dans le cadre de la relation utilisateurs. Par contre, toutes les définitions concernant cette pratique sont proposées également dans le chapitre précédent.
a. Définitions
Voir chapitre précédent.
b. Les objectifs de la pratique gestion des incidents
La gestion des incidents a deux objectifs distincts :
-
Rétablir le service dans un état normal, le plus rapidement possible conformément à la convention de services associée (SLA). Il ne s’agit pas de trouver une solution ni de comprendre la cause de l’incident, mais de restaurer le service pour que les utilisateurs puissent travailler. Cet objectif est un engagement de résultat.
-
Minimiser l’impact de l’incident sur les utilisateurs. À l’instar de l’objectif précédent, ceci n’est pas un engagement contractuel de résultat. La gestion des incidents doit faire au mieux pour que les utilisateurs soient le moins pénalisés par les effets de la panne ou du dysfonctionnement.
c. Les acteurs
Les acteurs de la pratique gestion des incidents sont les personnes que l’on appelle communément les groupes support.
Le centre de services est la pierre angulaire de toutes les activités de gestion des incidents (voir chapitre précédent). Les groupes "Études et Développements" et "Architectes" interviennent normalement dans les escalades niveau 2 ou niveau 3. Par contre, dans le cadre de ces activités, ces acteurs peuvent être en contact avec la relation utilisateurs.
2. La cartographie détaillée de la pratique
La pratique gestion des incidents est en relation de premier niveau avec les pratiques gestion des problèmes, gestion des changements, centre de services, gestion des niveaux de service, et supervision et gestion des événements, et en relation de second niveau avec les pratiques gestion des configurations, gestion de la sécurité informatique, gestion des fournisseurs...
La pratique gestion des problèmes
1. Généralités
a. Définitions
Problème
Un problème est une situation où l’on recherche la cause inconnue d’un ou plusieurs incidents. On ne peut parler de problème s’il n’y a pas eu au préalable un ou plusieurs incidents. Par contre, dans le cadre des activités dites proactives de la gestion des problèmes, le gestionnaire des problèmes peut ouvrir des problèmes qui sont liés à des situations répétitives qui traitent d’un dysfonctionnement ou des situations qui demandent des améliorations (sans incident au préalable). Un exemple est une situation d’événements récurrents.
Contrairement à la gestion des incidents, la gestion des problèmes va, elle, regarder les vraies causes, pour amener des solutions.
Erreur connue et une solution de contournement
Une erreur connue est un problème dont on connaît la cause et pour lequel on a identifié une solution temporaire ou définitive, que l’on ne va pas forcément mettre en œuvre tout de suite : il s’agit d’une solution dite de contournement, qui va permettre de contourner un incident similaire qui pourrait à nouveau se produire. On investigue donc sur la cause, on trouve cette cause, puis on trouve une solution, qu’elle soit patch ou correctif : on vient de transformer le problème en erreur connue.
L’ensemble des erreurs connues est enregistré dans une base de connaissances appelée base des erreurs connues, qui est mise à disposition du centre de services et de la pratique gestion des incidents.
b. Les objectifs de la pratique gestion des problèmes
La pratique gestion...
La pratique gestion des demandes de services
La pratique gestion des demandes de services fait partie intégrante de la phase du support opérationnel, mais aussi de la phase de la relation utilisateurs. Cette pratique est expliquée en détail dans le chapitre précédent.