La segmentation clients en marketing
Objectif du chapitre
La segmentation est le processus de regroupement d’éléments, de données ou de personnes en groupe homogène.
La segmentation est aussi appelée « analyse en grappe » ou encore « clustering ».
Cette approche est souvent utilisée en marketing afin de tenter de comprendre le comportement des clients.
L’idée principale est de créer des segments de marché homogènes dans le but de cibler au mieux les offres de produits.
Dans cette partie, nous allons aborder deux méthodes différentes de segmentation appliquées au marketing :
La segmentation par critères définis au préalable
Dans cette méthode, l’analyste définit a priori un ou plusieurs critères de segmentation.
La segmentation par la méthode des K-moyennes
Cette méthode est un algorithme d’apprentissage automatique (machine learning), les segments sont alors définis par un calcul mathématique.
La segmentation par critères définis au préalable
Selon cette méthode, l’analyste pose lui-même un ou plusieurs critères pour mettre en place une segmentation des clients.
De nombreux segments peuvent être choisis selon le contexte, le produit et la typologie des clients :
-
Géographique : taille de la ville, région, pays, climat
-
Démographique : âge, sexe, niveau d’étude, rémunération
-
Psychologique : motivation, personnalité
-
Image : statut social, image, loyauté à la marque
-
Lié à l’utilisation : intensité, cadre d’utilisation
Un croisement de plusieurs critères peut être proposé, par exemple, l’intensité de l’usage de chaussures de sport par âge des clients.
En pratique, l’analyste va tester de manière empirique plusieurs critères et/ou croisements de critères afin d’en déduire une segmentation pertinente.
Application avec Excel
Nous allons dans un premier temps réaliser une représentation graphique des données puis utiliser un tableau croisé dynamique pour segmenter les données sur un critère et réaliser une segmentation multicritère.
Vous retrouverez les données de cet exemple dans le fichier segmentation.xlsx. La résolution de l’application se trouve dans le fichier segmentation_resolu.xlsx.
Dans l’onglet données, la table sur laquelle nous allons travailler se présente de la manière suivante :
Le fichier est composé de deux onglets :
-
Données : il s’agit de la table sur laquelle nous allons travailler, cette table a été nommée au préalable Données.
-
Représentation graphique : nous allons y créer une représentation des achats par âge.
Segmentation sur un critère
Dans un premier temps, nous allons réaliser une représentation graphique du niveau d’achat par âge des clients, puis effectuer une segmentation basée sur l’âge des clients.
Représentation graphique du niveau d’achat par âge
Sélectionnez l’onglet représentation graphique.
Au niveau du ruban, cliquez sur l’onglet...
La segmentation clients avec la méthode des K moyennes
La méthode des K-moyennes, encore appelée méthode des K plus proches moyens est un des grands algorithmes d’apprentissage automatique (machine learning).
Plus spécifiquement, il s’agit d’un algorithme non supervisé (unsupervised learning) de classification.
Un apprentissage non supervisé est utilisé lorsque nous ne disposons que de données d’entrée (X) et aucune variable de sortie correspondante.
Dans notre cas, nous disposons de données clients mais nous ne connaissons pas encore la segmentation de ces clients.
Au contraire, l’apprentissage supervisé est utilisé lorsque nous disposons de variables d’entrée (x) et de variables de sortie (Y). Un algorithme est alors utilisé pour apprendre la fonction de mappage de l’entrée à la sortie.
La régression linéaire que nous avons vue au chapitre Établir des prévisions statistiques est un apprentissage supervisé.
Pourquoi utiliser un algorithme ?
Pourquoi réaliser une segmentation grâce à un algorithme alors qu’il serait plus facile a priori d’identifier des clusters simplement en traçant un nuage de points pour avoir une idée visuelle des segments qui semblent se dégager ?
L’utilisation de l’algorithme de segmentation des K-moyennes peut présenter des groupes que l’œil humain ne peut pas voir ou qui peuvent être difficiles à identifier manuellement.
C’est particulièrement le cas avec des jeux de données multidimensionnels.
La méthode des K-moyennes - Intuition
Le but de la méthode des k-moyennes est de déterminer une répartition des données en K groupes homogènes (ou segment).
L’algorithme va effectuer les opérations suivantes.
Déterminer des centroïdes au hasard
Dans cet exemple, nous avons choisi deux centroïdes (ou point archétype) en nous basant sur deux points faisant partie des données, il y aura autant de centroïdes que de segments :
Calculer la distance entre les centroïdes et chacun des points
La mesure de la distance peut être assez complexe en science des données, car il existe de nombreuses façons...