Le mouvement Open Data
L’approche Open Data
1. Principes
Le mouvement Open Data a pour objectif la mise à disposition de données en provenance des institutions (publiques et privées) et à destination des citoyens. L’action publique collecte et produit énormément de données dans le cadre de son activité, et le but de l’Open Data est que l’administration publique ouvre ces données à la collectivité.
L’Open Data a ceci de commun avec le mouvement open source que les données doivent être ouvertes et libres. Ceci ne force pas à la gratuité, mais celle-ci est souvent assurée sur les sources de données Open Data. L’ouverture se manifeste par le choix de licences garantissant que les données sont librement utilisables, protégeant ainsi les utilisateurs.
2. Objectifs
a. Transparence
L’objectif principal de l’Open Data, en tout cas tel qu’il est en général affiché, est la transparence de l’action publique. En exposant leurs données dans des formats plus facilement consommables que des registres, les institutions accomplissent de manière plus formelle leur devoir d’ouverture. La donnée publique est en effet souvent légalement accessible depuis longtemps, mais sa consommation n’est pas facilitée par son format papier et sa localisation dans les centres...
Historique du mouvement
1. Débuts internationaux
L’Open Data n’étant en soi ni une technologie ni un simple outil, mais bel et bien un mouvement politique, il est essentiel pour bien comprendre le sujet d’expliquer sa naissance et son historique, bien que celui-ci soit très récent. Ce mouvement est relativement récent, ce qui fait qu’il est abondamment documenté. Les sections suivantes résument les grandes étapes du mouvement jusqu’à début 2016, date d’écriture du présent ouvrage.
a. États-Unis
Les premières apparitions du concept d’Open Data datent du premier mandat de Barack Obama, aux États-Unis. Le principe derrière ce vocable est de rendre disponibles les données utilisées par l’administration publique dans le cadre de son activité pour une réutilisation par d’autres entités que l’État, typiquement les entreprises et les citoyens. Le public visé montre clairement la bivalence de l’enjeu politique derrière cette mise à disposition de la donnée publique : elle doit servir à la fois à améliorer la compétitivité des entreprises et à fournir un niveau de transparence de l’action publique plus élevé au citoyen.
Pour être plus précis, c’est bien dans un premier temps la transparence qui a été évoquée comme objectif du mouvement Open Data. Dès 2007, la loi dite Open Government Act posait les principes d’un accès libre à l’information publique. C’est lors de sa campagne électorale que Barack Obama a annoncé son intention de "renforcer la démocratie et son efficacité" par la mise à disposition de plus de données collectées par l’État. La promesse est tenue dès les premiers jours de son mandat, l’Open Government Initiative étant lancée le 20 janvier 2009.
L’utilisation de l’Open Data par les entreprises et dans un but d’efficacité non plus de l’État seulement mais également de la société civile qui s’approprie ces données est venue ensuite. Il s’agit d’une conséquence bénéfique...
Premiers résultats
1. Applications
Il faudrait un livre complet pour faire le tour de toutes les applications web ou mobiles mises à disposition à partir de la donnée publique. Encore que le livre serait sérieusement raccourci dès qu’un curseur qualité devait intervenir : de nombreuses utilisations sont en effet simplement constituées du placement de la donnée sur une carte avec un habillage un peu plus ergonomique permettant à l’utilisateur d’entrer des critères et de bénéficier d’un visuel plus attractif.
Dans tous les cas, les réutilisations sont aujourd’hui nombreuses et il n’y a pas d’intérêt ici à tenter d’en réaliser un catalogue obligatoirement non exhaustif et qui serait rapidement obsolète. Quelques applications peuvent toutefois être citées comme emblématiques du mouvement. Ainsi l’application d’Handimap, qui permet - dans les villes participantes - de déterminer les trajets optimaux pour les personnes à mobilité réduite. Les avertisseurs sonores de passage piétons sont mis en avant pour les personnes avec une déficience auditive, les trajets sans passages de trottoirs pour les utilisateurs de fauteuils roulants, etc. Ainsi, il est possible de prévoir un mode de trajet sur mesure en fonction de ses contraintes.
L’exemple ci-dessous montre un trajet accessible en fauteuil électrique dans la ville de Lorient (source : http://lorient-agglo.handimap.org/Lorient) :
Une autre application de l’Open Data qui a été rapidement mise en place, en particulier dans le cadre du premier concours organisé par la Ville de Rennes, est liée au recensement des jardins publics jusqu’au détail des espèces botaniques. Une des dernières manifestations de cette approche, centralisée désormais au niveau de la Bretagne, est le site web des arbres remarquables. L’URL http://www.arbres-remarquables-bretagne.org/ permet d’accéder à une carte des arbres avec photos.
Le domaine des transports est également un grand fournisseur (mais aussi consommateur) de données. La RATP et la SNCF ont longtemps fait attendre leurs données, mais récemment commencé à ouvrir cette...
Utilisations de la donnée publique
1. Centralité de l’usage
Jusqu’à maintenant, nous n’avons parlé que de données, mais quel est l’usage derrière cette donnée brute ? Comment faire en sorte que cette donnée soit une réelle information et qu’elle apporte de la connaissance. La sémantique dans cette dernière phrase est importante car :
-
63,03 est une donnée ;
-
63,03 millions d’habitants en France en 2013 est une information ;
-
Cette information participe à la connaissance de la démographie française, en aidant à la compréhension de l’évolution de celle-ci.
Les données sont parfois brutes au point de ne pas préciser les unités associées, ce qui les rend quasiment inutiles puisqu’elles ne pourront alors pas porter d’information, ou en tout cas pas sans un niveau d’incertitude très élevé.
Certaines informations, de la même manière, sont tellement parcellaires qu’on ne peut en tirer qu’une connaissance très limitée. La population de la France était-elle décomptée par recensement ou estimée par des méthodes statistiques ? S’agit-il bien de la population de la France entière et non pas de la population métropolitaine seulement ? Comment ce nombre s’inscrit-il dans l’évolution de la population ? En hausse, en baisse ?
On voit bien que toutes ces questions n’ont aucun sens si on ne se pose pas la question de l’usage. À quoi la donnée sert-elle ? En fonction de la réponse, les données attendues ne seront pas les mêmes. Par exemple, l’état des routes sera particulièrement important pour un usage destiné à des cyclistes, alors que l’usage de la même donnée des routes par un transporteur donnera plus d’importance à la dénomination exacte de celles-ci afin de pouvoir croiser ces données avec les données de trafic en temps réel et donc améliorer sa tournée.
2. Restriction des formats
À l’inverse, il est essentiel de ne pas publier de la donnée qui soit trop fortement attachée à un seul usage, sous peine de se couper de nombreux usages potentiels....