Datalgo

ConfidentialitéCommanderEntrepriseChercherContact

data cleaning

 Simplifiez la gestion de vos données


AccueilForfaits tout comprisDédoublonnageVérificationEnrichissementConversionNormalisationText miningStructuration

Votre métier Marketing & commercial | Ressources humaines | Finance | Communication | Juridique | Associations

Accueil > Flash conseils > Consulter > Flash du 15-04-2005

Toutes nos infos
  Solutions :
 

Forfaits tout compris
  Traitements à la carte
  Par métiers
 

Datalgo :

  Tarifs et abonnements
  Fonctionnement
  Savoir faire
  Confidentialité
 

Newsletter :

 

Flash conseil gratuit

  S'abonner
  Consulter
 

Recherche rapide :

 

Ne détruisez pas tous vos enregistrements en double ou périmés !

15-04-2005 • Conserver certaines informations obsolètes ou en doublon permet d'anticiper certaines problématiques courantes dans les bases de données.

 Constat > 

Ceux qui gèrent un fichier le savent, détruire un enregistrement peut être un préjudice. Qu’il soit modestement enregistré sur un tableur ou dans un gros système, l’enregistrement (la fiche ou ligne de données) que vous supprimez peut être encore utile ! Dans plusieurs cas, vous pouvez avoir besoin de retrouver cet enregistrement :

L’enregistrement est de nouveau d’actualité

C’est le cas d’un client ou contact, parti puis revenu. Ou encore le cas d’un projet abandonné qui peut redevenir d’actualité. Dans le cadre d’une relation commerciale, si l’un de vos contacts change de société, ou d’adresse, il peut être très intéressant de connaître ses intentions d’achat au regard des commandes déjà réalisées dans son ancienne société ou à son ancienne adresse.

Forfait dédoublonnage
Dédoublonnage
ou
déduplication
Forfait tout compris
-20% à partir de

713€ 570

Infos

L’enregistrement n’était pas un doublon

Un usager de la base de données supprime une ligne de vos données pensant, à tors, qu’il s’agit d’un doublon. Par exemple, l’entreprise « Concept SARL » peut être confondue à tors avec la société « Concept SA » ou même le « Groupe Concept ». Une suppression trop rapide peut avoir un retentissement très négatif lorsqu’il s’agit d’un client !

L’enregistrement est supprimé par mégarde

Chaque individu lorsqu’il travaille sur une série de données commet statistiquement 1% d’erreurs. Selon une étude du Data Warehousing Institute menée en 2001, les erreurs rencontrées dans les bases de données sont dans les trois quarts des cas provoquées par les salariés de l'organisation.

L’enregistrement est supprimé de façon malintentionnée

Des données sensibles partagées par plusieurs personnes ou une base de données en accès libre.

L’enregistrement est recréé par mégarde

Ce cas est particulièrement fréquent. Une personne décédée, ou ayant quitté une société (NPAI) est recréée dans la base de données lors de l'importation d'un fichier externe ou à l'occasion de la fusion de deux fichiers. Comme l'on a pas gardé trace de la suppression, cette personne va recevoir à nouveau des courriers. Lorsque la personne a disparue depuis plusieurs années, l'image et le sérieux de la société qui continue à envoyer des courriers en prend un sérieux coup. Si un autre contact a demandé à ne pas être sollicité par courrier électronique (loi Informatique et Liberté), vous risquez dans un cas analogue, par simple fusion de fichier de le prospecter à nouveau à son insu.

 

L’historique a une valeur commerciale et juridique

  • Tracer le client ou contact : si vous supprimez toutes les ventes d’un produit dans une base client, ou toutes les actions entreprises avec un contact (mailing, salon, téléphone), vous ne pouvez plus attribuer un score aux meilleurs contacts ou clients.

  • Comparer les données : une information périmée peut dans de nombreux cas continuer d’être une donnée intéressante : ainsi, les greffes des tribunaux de commerce conservent toutes les données des entreprises déclarées, y compris celles qui n’ont plus aucune existence ou activité. Ainsi, en comparant votre fichier à celui des greffes via le SIREN vous pouvez tout naturellement mettre de côté les clients ou prospects ayant mis la clef sous porte.

En somme, en terme de gestion de la connaissance (knowledge management) on affirme que la « non-information » est une information ! Dans le domaine de l’intelligence économique appliquée aux brevets, savoir qu’une société ne dépose plus de nouveaux brevets dans un domaine est une information intéressante qui amène des conclusions sur sa stratégie de recherche.

 

 Objectif > 

Mettre des données en veilleuse et élaborer une méthode de suppression contrôlée pour limiter les effets indésirables des destructions de données.

 

 Méthode > 

La mise en veilleuse de données

Plutôt que de supprimer un enregistrement dans la base de données, on signale de manière distinctive son obsolescence. Pour cela, il est fortement conseillé d’ajouter un champ validation (« statut », « marqueur » ou « flag ») dans votre base sur 100% de vos données. Vous aurez intérêt à faire disparaître visuellement toutes les données qui ne sont pas actives afin de ne pas perturber l’utilisateur. Ainsi, plutôt que de supprimer réellement un enregistrement, désormais, vous utilisez ce marqueur pour signaler qu’une fiche est passée d’un statut d’actif à un statut d’inactif.

Qualifier le statut

Afin de rendre encore plus intéressante l’utilisation des statuts sur votre base de données, imposez différents statuts pour le même champ. Ainsi, pour un fichier commercial, vous pourrez proposer plusieurs statuts correspondants à un état de la société :

  1. Prospect : société à approcher commercialement
  2. Client : a commandé il y a moins de 3 ans
  3. Doublon : fiche en double
  4. NPAI : N’habite Plus à l’Adresse Indiquée
  5. Liquidation : société n’existant plus
  6. Fusion : société absorbée par une autre

Dans cet exemple, ces six statuts permettent à la fois de conduire la relation commerciale (CRM) en distinguant les clients des prospects, mais aussi de qualifier les raisons de mise en veilleuse de certaines sociétés. Dans la pratique, votre fichier ne rendra visible que les enregistrements de type 1 et 2 (prospects et clients). Les autres seront simplement cachés.

La suppression contrôlée

Il s’agit de mettre en place une procédure périodique de suppression réelle des données indésirables. Pourquoi ? Pour éviter l’encombrement de votre disque dur avec des données dont l’obsolescence est devenue irréfutable. Dans l’exemple plus haut, il peut s’agir des « doublons », des « sociétés en liquidation » ou des « fusions de sociétés ». Ainsi, on peut se donner un délai de suppression dont la périodicité est à définir. A chaque échéance, il vous appartient de supprimer les données dont le statut n’est plus d’actualité. Il est recommandé de réaliser une requête ou un tri sur vos données en vous appuyant sur votre champ « statut » et la date de mise à jour de chaque fiche. Ainsi, vous pouvez ne supprimer que des fiches archivées depuis une période données (par exemple, ne supprimer les fiches qu’à partir du moment où elles sont en veille depuis plus d’un an).

De telles procédures consistant à mettre en réserve les suppressions permet de répondre au problème fréquent de fusion de deux organisations. C'est le cas de sociétés rachetées qui doivent consolider leur fichier clients, ou d'organisations dont certaines données sont mises en commun ou enrichies par des canaux extérieurs : site web, appels téléphoniques entrants, etc. Ainsi, une procédure de dédoublonnage sur les données archivées permettra de corriger a posteriori vos informations.

Obligations légales

Dans un pays comme la France, la possibilité de suppression définitive des données est obligatoire. Ainsi, dans l’hexagone, l’exploitant d’une base enregistrant des données personnelles doit faire une déclaration à la CNIL dans laquelle il précise la durée de conservation des données et s’engage à respecter l'article 16 de la loi du 6 janvier 1978 (modifiée le 6 août 2004) relative à l'information, aux fichiers et aux libertés. Aujourd’hui, remplir une déclaration simplifiée est une opération qui prend à peine quelques minutes et peut se faire en ligne sur le site de la CNIL.

La loi vous oblige à respecter pour chacun de vos contacts les options de permission marketing. C'est-à-dire, la volonté qu'à chaque contact d'accepter ou de refuser la prospection par courrier électronique. Raison de plus pour ne pas supprimer vos anciens contacts, même si ceux-ci refusent d'être sollicités. S vous importiez un fichier avec de nouveau les mêmes contacts, vous risqueriez d'enfreindre leur volonté et la loi en renouvelant votre prospection par email. De fait, en plaçant vos anciens contacts en archive, vous disposez automatiquement d'un fichier repoussoir.

Par ailleurs, dans certains cas, la nouvelle loi LCEN du 22 juin 2004 oblige le possesseur d'une base de données à conserver 10 ans minimum certains types d'informations.

 

 Solutions 
 Datalgo > 

Contrôler la déduplication et la suppression de données

Datalgo vous apporte des solutions faciles pour gérer au mieux vos suppressions de données. Nous pouvons par exemple procéder pour vous au rapprochement de vos fichiers avec des bases de données externes. En achetant des données externes régulièrement tenues à jour, et en les rapprochant de vos propres données, vous pouvez effectuer des mises à jour ou suppression de données automatiquement et très rapidement. Datalgo propose également des solutions de dédoubonnage qui vous aident à inscrire le statut « doublon » sur certains de vos enregistrements.

 

 

 

 
Tous droits réservés
Le contenu de cette lettre d'information
ne saurait engager la responsabilité de Datalgo.

 

FORFAITS | Dédoublonnage | Vérification | Enrichissement | Conversion | Normalisation | Text mining | Structuration
 Contact | A propos de Datalgo | Chercher | Commander | © Datalgo