Comprendre le Data Mining à travers un cas client
l'info à retenir
+13%

Augmentation du CA total grâce au Data Mining

Les problématiques des entreprises qui font le choix du Data Mining sont nombreuses, variées et souvent complexes. Afin de mieux les appréhender, nous allons décrypter pas à pas la démarche à suivre à travers la présentation d’un cas client : la Droguerie de Ma Grand-Mère, entreprise de vente à distance spécialisée dans les produits de droguerie.

Pour des raisons de confidentialité et de clarté, l’exemple que nous vous proposons est un « cas d’école » au nom fictif et à la démarche simplifiée, mais construit à partir d’exemples bien réels.

Problématiques du client et du secteur

La Droguerie de Ma Grand-Mère (DMGM) est une entreprise de vente à distance (VAD), spécialisée dans la vente aux particuliers de produits de droguerie : produits d’entretien domestique, produits de soins corporels, produits santé/bien-être, produits pour animaux, produits de jardinage, etc.

La DMGM commercialise ses produits :

  • sur son site internet ;
  • en vente par correspondance (VPC) grâce à son catalogue mis à jour chaque année (environ 200 pages et plus de 9 000 références). Ce catalogue est envoyé tous les ans aux clients de l’entreprise (environ 120 000 clients recensés dans la base CRM) mais il est également utilisé pour des campagnes de prospection commerciale par voie postale (près 400 000 envois par an).

Mais la DMGM est confrontée :

  • à un déclin régulier des performances de ses campagnes de prospection commerciale (taux de retour aujourd’hui à peine supérieur à 1%), dont le coût ne cesse par ailleurs d’augmenter.
  • à l’érosion de la fidélité de ses clients, à la stagnation du nombre d’achats par client et à celle du panier moyen.

Dans ce cas, l’usage du Data Mining aura pour objectifs :

  1. D’augmenter la fréquence des achats et le montant du panier moyen pour ses clients actuels.
  2. D’améliorer l’efficacité des campagnes de prospection commerciale en améliorant les taux de retour et en réduisant leur coût.

Solution Data Mining #1 : Construction d’une segmentation fine du portefeuille clients

segmentation client

Etape 1 : Segmentation des clients par comportement d’achat

Pour augmenter la fréquence des achats et le montant du panier moyen, la démarche de Data Mining est la suivante :

  1. Centralisation de l’ensemble des données disponibles sur les clients de DMGM : nom, prénom, adresse postale, historique des achats (catalogue et site internet), historique des réclamations, historique des sollicitations par canal, etc.
  2. Phase de dataquality pour « nettoyer » les données : dédoublonnage, normalisation des adresses postales, identification des foyers, suppression/correction des valeurs erronées ou aberrantes.
  3. Enrichissement par des données externes :
    – données géomarketing liée à l’adresse du client (taille de la commune, profil sociodémographique du quartier, etc.)
    – score prénom pour estimer l’âge du client
    – rapprochement de la base clients avec le fichier SIREN pour identifier d’éventuels clients « professionnels » et enrichissement par des données sur l’entreprise le cas échéant (secteur d’activités, CA, taille, catégorie juridique, etc.)
  4. Construction d’une segmentation des clients par comportement d’achat via une analyse typologique multivariée.

 

4 macro-segments ont ainsi été dégagés lors de cette 1ère étape :

macro segments

Les particuliers mono-catégorie concentrent leurs achats sur une seule catégorie de produits : entretien de la maison ou santé/bien-être. Ce sont essentiellement des acheteurs VPC (catalogue). Une niche particulière a été isolée : les clients à la recherche de produits de lutte et de prévention contre les insectes.

Les particuliers multi-catégories panachent leurs achats sur plusieurs catégories de produits (3 et plus). Ils sont intéressés aussi bien par les produits d’entretien que les produits de jardinage ou les soins corporels. Ils sont aussi bien acheteurs en ligne que VPC.

Les particuliers bio sont des acheteurs exclusifs de produits bio. Ils panachent leurs achats dans les catégories de produits entretien de la maison, santé/bien-être, soins corporels et jardinage. Ils sont aussi bien acheteurs en ligne que VPC.

Les entreprises : le rapprochement de la base clients avec le fichier SIREN et l’analyse détaillée des caractéristiques d’achats ont permis d’identifier un segment de clients qui sont en réalité des professionnels, issus majoritairement des secteurs des services : hôtellerie/restauration, petits commerces et services à la personne. Ce sont des entreprises de petite taille (<10 salariés), plutôt à la recherche de produits d’entretien bio/naturel en quantité importante. Ce sont des acheteurs essentiellement VPC (catalogue).

 

Etape 2 : Segmentation RFM (récence-fréquence-montant)

Afin de hiérarchiser les clients selon leur activité et leur valeur économique (CA), il est nécessaire d’effectuer une segmentation plus poussée dans chacun des 4 macro-segments. Ainsi, l’utilisation de la segmentation complémentaire de type RFM (récence-fréquence-montant) permet de mettre en exergue différents profils de clients à l’intérieur de chacun de ces segments.

segmentation rfm

 

Etape 3 : les actions mises en œuvre sur la base des résultats obtenus

Au vu des résultats obtenus, l’entreprise a donc opté pour l’abandon d’un catalogue général unique au profit de 5 catalogues thématiques beaucoup moins volumineux pour la prospection commerciale et un catalogue à destination des entreprises. Les actions marketing ont également été repensées en fonction des segments visés et des profils clients à l’intérieur de chaque segment.

 

resultats datamining

 

Etape 4 : le bilan des actions mises en œuvre

  • CA total : +13%
  • Nombre de clients particuliers actifs : +9%
  • Nombre de clients entreprises actifs : +17%
  • Panier moyen : +10%
  • CA Produits Bio : +28%
  • CA Produits Entreprises : +19%
  • Réduction Coût Impression Catalogues : -32%

Solution Data Mining #2 : Construction d’un score de répondants aux campagnes de prospection commerciale

La DMGM réalise 2 campagnes de prospection commerciale par envoi de catalogue, pour un total de 300 000 catalogues envoyés chaque année. A cette fin, la DMGM loue des adresses de prospects particuliers auprès de brokers de fichiers sans ciblage précis ; plusieurs fichiers sont ainsi « essayés » chaque année. Mais les taux de réponse enregistrés sont en baisse régulière depuis plusieurs années pour se stabiliser aujourd’hui autour de 1%.

L’entreprise a donc décidé de construire un modèle de score de prospection ayant pour objectif de déterminer la probabilité de réponse d’un prospect, en fonction de ses caractéristiques. Plus la note de score est élevée pour une adresse, plus grande est la probabilité qu’elle réponde favorablement à la sollicitation. Un modèle de score permet ainsi un meilleur ciblage des envois de catalogues.

Etape 1 : le Data Mining

  1. Récupération des données individuelles correspondant aux campagnes de prospection des 2 dernières années :
    – nom, prénom et adresse postale du prospect
    – résultat de la prospection (a répondu/n’a pas répondu)
    – données socio-démographiques disponibles (variables selon le fichier d’origine du prospect)
    600 000 adresses ont ainsi été centralisées.
  2. Enrichissement des données individuelles par des données géomarketing :
    – à l’IRIS (profil socio-démographique du quartier)
    – et à la commune (type de commune)
    – ainsi que l’âge des prospects par score prénom
  3. Les données disponibles ont été divisées en deux parties :
    – une base d’apprentissage (400 000 individus) pour la construction du modèle de score
    – une base de test (200 000 individus) pour tester les performances du modèle obtenu
  4. Le modèle a été estimé, et il est apparu que les variables ayant une influence significative sur le fait de répondre à l’offre de la DMGM étaient l’âge, le sexe, la taille de la commune, le département et le type de quartier.
  5. Le modèle a ensuite été appliqué aux adresses de la base de test, afin d’évaluer sa capacité à détecter les répondants réellement enregistrés durant les campagnes. Le modèle s’étant avéré performant, les adresses de prospects louées ont ensuite été scorées à l’aide du modèle. Ainsi, seules les adresses présentant un niveau élevé de probabilité de réponse favorable sont désormais sélectionnées.

Etape 2 : un meilleur ciblage

Lors de la campagne de prospection suivante, l’ensemble des adresses potentiellement exploitables (1 million) ont été scorées. Seules les 300 000 adresses présentant les notes de score les plus élevées ont été sélectionnées.

Etape 3 : le bilan des actions mises en œuvre

Le taux de retour global des campagnes de prospection de l’entreprise est passé de 1% à 1.8%. Sur le segment des 50 000 meilleures adresses (scores les plus élevés), le taux de retour est aujourd’hui de 2.3%.

En conclusion

Fichiers clients, données off line, on line, open data, social data, objets connectés… Les données sont partout, multiples, complètes, et de plus en plus faciles d’accès dans leur état brut. Mais c’est bien le Data Mining qui les rend intelligibles et intelligentes. Pourquoi ? Parce qu’il est au centre de la transformation des données en réponses marketing concrètes, rationnelles et mesurables.

A propos de l'auteur

Avatar Philippe Nanopoulos

Philippe Nanopoulos

Philippe Nanopoulos est consultant au sein du pôle Connaissance Client du Groupe IDAIA à Strasbourg.
Par ailleurs, il conseille entreprises privées et organisations publiques depuis 20 ans sur la chaîne de valeur des données clients (collecte, stockage, organisation, analyse et diffusion).
Il est aussi enseignant-chercheur à l’Ecole de Management de Strasbourg (Université de Strasbourg) au sein du Département Marketing.

Des remarques sur “Comprendre le Data Mining à travers un cas client

  1. merci pour cet article qui a bien détaillé l’ensemble des processus big data nécessaire pour comprendre les profils des clients et dégager leurs affinités et aoutir à un meilleur ciblage

    fairouz, le
    Répondre
  2. Je trouve cet article très intéressant.
    En effet, très utile à la compréhension du cours

    Cordialement Nouhaila Goujili

    CHLOE CORDOVAL, le
    Répondre

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*