Blog ENI : Toute la veille numérique !
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
💥 Les 22 & 23 novembre : Accès 100% GRATUIT
à la Bibliothèque Numérique ENI. Je m'inscris !

Introduction à l’analyse d’audience

Introduction

Les objectifs de ce chapitre sont :

  • de vous faire découvrir l’analyse d’audience ;

  • de comprendre le socle technologique d’une solution en analyse d’audience.

Ce chapitre s’adresse principalement aux profils suivants :

  • Formateurs 

  • Utilisateurs de Matomo 

  • Développeurs 

  • Administrateurs système

Qu’est-ce que l’analyse d’audience ?

L’analyse d’audience d’un site internet, intranet, d’une application mobile, voire même d’un système d’information c’est avant tout la collecte et l’analyse des données quantitatives, qualitatives et de la concurrence pour mener à une amélioration continue de l’expérience des internautes.

Cela va se matérialiser par des données que vous allez collecter de toutes parts et ensuite analyser pour prendre des décisions.

Matomo, qui est le sujet de cet ouvrage, est principalement une solution d’analyse d’audience quantitative, c’est-à-dire qu’elle collecte tout un ensemble de données qui, en l’état, ne permettent pas de répondre directement à vos problématiques. Sur la base de ces données collectées, vous allez devoir effectuer un travail “mental” en émettant des hypothèses pour pouvoir améliorer votre système d’information (site, application, objet connecté). Il y a donc un travail de réflexion à mener en amont, afin de structurer ces données et de les rendre exploitables pour l’analyse.

Par exemple, si le nombre de visites de votre site pour aujourd’hui est dix fois supérieur à celui d’hier, c’est à vous de supposer qu’un événement s’est produit, et d’analyser les données pour en connaître la raison (la solution en analyse d’audience ne peut pas le faire pour vous).

Petite particularité cependant, parmi l’ensemble des solutions en analyse d’audience quantitative présentes sur le marché, Matomo est un logiciel libre. Cela signifie qu’il est possible de lui rajouter des fonctionnalités sans avoir à...

À quoi sert l’analyse d’audience ?

Comme son nom l’indique, l’analyse d’audience permet d’étudier tout (individus, machines ou animaux) ce qui visite votre système d’information (site, application, objet connecté…) et de savoir ce qu’ils font et comment ils sont venus. Cependant, l’idée de fond reste la même, c’est à vous de réaliser tout le travail de réflexion pour interpréter les données.

Le système d’information (exemple : Matomo) collecte (suite à des instructions que vous lui communiquez). À vous d’analyser.

Gardez cette phrase en tête qui nous vient de l’un des analystes les plus influents :

« La vie n’est qu’une succession de prises de décisions : si votre travail ne débouche sur aucune décision, arrêtez-vous pour reconsidérer votre approche. » (Avinash Kaushik)

Qui est Avinash Kaushik  ?

Avinash Kaushik est l’auteur de plusieurs ouvrages, dont le livre Web Analytics 2.0. Publié en 2009, il s’agit d’un livre très visionnaire toujours très lu par les web analystes. Avinash Kaushik est également connu comme évangéliste au sein de Google pour la solution Google Analytics.

Pour résumer, l’analyse d’audience sert à prendre des décisions pour améliorer votre site internet, votre application mobile, votre site intranet, votre objet connecté, etc. Ces décisions peuvent prendre différentes formes :

  • Changer la charte graphique.

  • Renommer l’intitulé d’un bouton.

  • Retirer un captcha.

  • Tester des formulaires.

  • Modifier un code de suivi existant.

  • Embaucher une nouvelle ressource.

  • Etc.

Tout dépend des hypothèses que vous allez formuler....

Les solutions d’analyse de données quantitatives

Les solutions dites quantitatives récupèrent tout un ensemble de données vous permettant de voir les tendances. Par exemple, lorsque vous recevez dix fois plus de visites sur votre site durant les week-ends, vous pouvez émettre l’hypothèse que les personnes recherchent plus vos produits et services à ce moment précis. De même, si vous avez un taux de rebond beaucoup plus élevé suite au changement de charte graphique de votre site, cela peut signifier que votre nouveau site semble moins plaire aux internautes et qu’ils ont besoin d’un temps d’adaptation supplémentaire.

Qu’est-ce qu’un taux de rebond ?

Le taux de rebond est un indicateur souvent présent dans les rapports en analyse d’audience. Il correspond aux visiteurs qui sont venus sur votre site sans interagir avec celui-ci. On parle alors de rebond, comme le ferait une balle sur un mur. Par exemple, le fait d’arriver sur un site web, de ne consulter qu’une page et de le quitter sans interagir avec celui-ci. On peut aussi parler de taux de déchet même si, naturellement, il faut toujours remettre cela dans le contexte du site.

Il existe toute une série de solutions d’analyse de données quantitatives pour les systèmes d’information. 

Parmi ces dernières, il existe deux grandes catégories :

  • Les solutions d’analyse de fichiers journaux (en anglais on appelle cela des logs), c’est le cas d’AWStats, de GoAccess, tous les deux sous licence libre. Vous avez également peut être entendu parler de Splunk, ou encore de SawMill en licence propriétaire. Les fichiers journaux sont automatiquement collectés par votre serveur, vous n’avez rien à faire de spécifique.

  • Les solutions d’analyse...

Les solutions d’analyse de données qualitatives

Les solutions d’analyse de données qualitatives vous permettent de répondre à la question « pourquoi ? », chose qu’une solution quantitative ne peut pas faire. Ces données sont cependant plus compliquées à collecter car elles nécessitent un effort volontaire de la part de votre audience. 

Voici quelques exemples de système d’analyse de données qualitatives :

  • vous mettez en place des sondages en ligne,

  • vous demandez à un de vos amis ou un de vos collègues ce qu’il pense de votre site,

  • vous utilisez de l’eye tracking (mise en place d’un casque permettant de voir où vos yeux regardent), 

  • vous organisez des groupes utilisateurs.

Comme indiqué précédemment, ces solutions vous permettent d’avoir la réponse à la question que vous posez. Prenons le cas d’un utilisateur qui vient sur votre site et reste trois minutes. Vous ne savez pas vraiment s’il a apprécié votre site. Pour vous en assurer, vous pourrez lui poser la question durant la visite par l’intermédiaire d’une fenêtre de chat et si celui-ci vous répond, vous obtiendrez une information à forte valeur ajoutée. Le chat est dans ce cas de figure une solution de récolte de données qualitatives.

Les solutions d’analyse de données de la concurrence

Les solutions d’analyse de la concurrence vous permettent de mettre en perspective vos performances par rapport à celles de vos concurrents. Par exemple, comment savoir si cent visites par mois pour votre site correspondent à une bonne ou une mauvaise performance ? Pour le savoir, il vous faut une base de référence (c’est-à-dire un historique de données) et/ou vous comparer à vos concurrents. Typiquement, dans ce cas de figure, vous pourrez utiliser une solution d’estimation de trafic.

Il existe de nombreuses solutions disponibles ou méthodes à utiliser en fonction des indicateurs que vous souhaitez comparer, en voici quelques exemples :

  • SEMRush permet d’estimer le trafic d’autres sites et d’avoir des extraits de leurs campagnes publicitaires, https://www.semrush.com/

  • Societe.com est une base de données permettant d’obtenir des indications comptables et commerciales telles que le chiffre d’affaires de certaines entreprises ; cela peut être intéressant dans certaines configurations telles que l’e-commerce.

  • Les réseaux sociaux vous donnent rapidement le nombre d’abonnés/fans de vos concurrents sur leurs pages, leurs fréquences de publication…

Ci-dessous un exemple de l’interface graphique de la solution d’analyse de la concurrence Semrush :

images/01OW04.png

Le marché des solutions en analyse d’audience quantitative

Il est difficile de connaître les parts de marché précises des différentes solutions d’analyse d’audience quantitative à travers le monde. En fait, tout dépend du mode de calcul utilisé, de la définition que l’on donne d’une solution en analyse d’audience, des marchés cibles, etc. Cependant, les différentes sources que vous pourrez trouver sur internet convergent sur le fait que Google Analytics est, à l’heure de l’écriture de ces lignes, la solution la plus utilisée du marché (sources : W3Techs https://w3techs.com, BuiltWith https://trends.builtwith.com/analytics/audience-measurement).

images/01OW05.png

La plupart de ces sources d’informations prennent en compte dans les parts de marché des solutions analytiques quantitatives « incomplètes », c’est-à-dire différentes de Google Analytics (qui sert de base de référence).

Dans ce chapitre, nous avons pris le parti de ne présenter que les solutions qui ont des fonctionnalités plus ou moins équivalentes à celles de Google Analytics. Nous ne présentons donc pas les solutions telles que le Pixel de Facebook, WordPress Jetpack ou encore Hotjar.

1. Google Analytics

images/01OW06.png

Créée par Google suite au rachat de la société Urchin Software Corporation, Google Analytics et ses déclinaisons (Universal Analytics, GA4) est la solution la plus utilisée du marché. À l’exception naturellement de quelques pays, comme par exemple la Chine, pour lesquels une partie des requêtes à envoyer aux serveurs de Google est bloquée, ce qui rend la solution peu fiable.

Son modèle d’affaires repose sur le fait de mettre une solution « gratuite »...

Quelle solution analytics choisir ?

Il y a quelques années, nous vous aurions dit que tout dépend de la problématique que vous avez à gérer. Mais aujourd’hui, force est de constater que le marché est hésitant (faut-il quitter Google Analytics ? Va-t-on être sanctionné en l’utilisant ?), avec le Règlement Général sur la Protection des Données (RGPD) européen qui vient restreindre de manière drastique le type de données utilisateurs collectées et précise le cadre de cette collecte, ainsi que la mise en œuvre de textes de loi proches dans d’autres régions du monde. Et, bien sûr, cela s’accompagne des diverses acquisitions d’entreprises sur le marché. Que se passerait-il si la solution sur laquelle vous stockez vos données d’analytics venait à disparaître, ou à être vendue à un acteur ne pouvant respecter les législations en vigueur, RGPD en premier ? Dans ce contexte, les logiciels libres sont le seul gage de confiance que vous pouvez avoir, votre seule valeur sûre.

Nous avons souvent au téléphone des prospects qui nous disent que finalement ils ne choisiront pas Matomo et décident de s’orienter vers une solution propriétaire (inconnue) mais qui a probablement un meilleur discours commercial. Nous leur répondons simplement :  “Installez quand même Matomo, car il en restera toujours quelque chose.” C’est un bien commun.

Comprendre le fonctionnement d’une solution en analyse d’audience quantitative

Comme son nom l’indique, une solution en analyse d’audience quantitative analyse une audience. Pour permettre cette analyse, la solution a besoin d’analyser des données. Ces données sont stockées dans ce que l’on appelle une base de données. Une base de données est donc un lieu qui stocke des données de manière informatisée, c’est aussi simple que cela.

Schématiquement, elles sont souvent représentées dans les livres informatiques par le logo suivant :

images/01OW12.png

Pour écrire, lire et traiter les données dans une base de données, l’utilisation d’un logiciel spécifique est requise. Ce type de logiciel s’appelle aussi simplement Système de Gestion de Base de Données (ou SGBD). Il existe plusieurs solutions de SGBD, et pour n’en citer que quelques-unes, mentionnons MongoDB, Microsoft Access, MySQL, MariaDB, SQLite.

Lorsque vous utilisez une solution propriétaire, il est assez rare que l’éditeur de la solution vous donne accès à la base de données voire vous communique le nom de la technologie choisie. Essayez par exemple de faire une recherche sur un moteur pour découvrir les technologies utilisées derrière Google Analytics, Adobe Analytics, Yandex Metrica, etc. Cela fait, d’une certaine manière, partie de sa recette de fabrication, il ne communique pas dessus. Et si jamais l’éditeur de la solution vous donne accès à cette base, c’est en général avec un accès restreint, vous ne pouvez pas voir tout ce qui a été réellement collecté.

Lorsque vous utilisez un logiciel libre tel que Matomo, en revanche, vous avez accès à l’ensemble...

Comprendre la notion de vie privée en analyse d’audience

Vous l’aurez compris à la lecture de ce premier chapitre, les solutions en analyse d’audience posent de vraies questions en termes de vie privée et ce, à plusieurs niveaux :

  • Comment a été développé le logiciel analytics ? En réalité ici, à moins d’avoir un logiciel dont le code source a été libéré, rien ne prouve que le logiciel agit tel qu’il est présenté.

  • Quelles sont les données collectées par le tracker ? Le gestionnaire d’un site est en effet techniquement libre de pouvoir exécuter ses codes de suivi comme il l’entend.

  • Quelles sont les règles qui régissent le système d’information mesuré ? En effet, mettre en place une solution analytics sur un site web où vous ne connaissez pas vos visiteurs, ce n’est pas la même chose que de la mettre sur un intranet qui, lui, est soumis à un règlement intérieur (le salarié est-il autorisé à aller sur Internet sur ses heures de travail ?).

  • Qui est l’éditeur de la solution ? S’il s’agit d’un grand acteur, il y a plus de chances que celui-ci puisse croiser les données.

  • Quels sont les termes du contrat qui a été signé avec l’éditeur du logiciel ? En gros, ce sont les conditions générales d’utilisation.

  • Quelle est la nationalité de l’éditeur du logiciel et quel est le lieu d’hébergement des données ? On l’a vu précédemment, en théorie, une entreprise américaine, de par le Cloud Act, ne respecte pas la vie privée des utilisateurs dont les données ont été collectées....