Datalgo

ConfidentialitéCommanderEntrepriseChercherContact

data cleaning

 Simplifiez la gestion de vos données


AccueilForfaits tout comprisDédoublonnageVérificationEnrichissementConversionNormalisationText miningStructuration

Votre métier Marketing & commercial | Ressources humaines | Finance | Communication | Juridique | Associations

Accueil > Flash conseils > Consulter > Flash du 16-05-2005

Toutes nos infos
  Solutions :
 

Forfaits tout compris
  Traitements à la carte
  Par métiers
 

Datalgo :

  Tarifs et abonnements
  Fonctionnement
  Savoir faire
  Confidentialité
 

Newsletter :

 

Flash conseil gratuit

  S'abonner
  Consulter
 

Recherche rapide :

 

Ne vous laissez pas piéger par les dates de mise à jour

16-05-2005 • Les dates de mises à jour enregistrées dans les bases de données sont nécessaires mais elles doivent être utilisées avec discernement.

 Constat > 

Vous administrez une base de données ou achetez un fichier externe dans lequel figure la date de mise à jour. Cette date peut avoir des significations diverses selon l’usage qu’en font les administrateurs. Contrairement bien des idées reçues, des dates anciennes ne signifient pas pour autant que tout votre fichier est mauvais.

Cas 1 : une date pour tout le fichier

Votre fichier a pour seule date de mise à jour le jour et l’heure auxquels a été enregistré votre fichier. C’est probablement le cas le plus fréquent, tout particulièrement lorsque le fichier est suivi dans un tableur de type Excel. Inconvénient : la date correspond en réalité à la dernière des mises à jour, et de fait rend caduque la validité des plus anciennes fiches de la base de données.

Vérification des codes SIREN
SIREN
Vérifiez vos codes
à partir de

69

Infos

Cas 2 : une date pour chaque fiche

Votre fichier possède pour chaque enregistrement la date de mise à jour de la fiche. Ainsi, chaque ligne du fichier a une date précise. C’est le cas le plus apprécié car il permet de sélectionner dans la base de données les enregistrements les plus récents.

Cas 3 : une date pour chaque champ

Votre fichier possède pour chaque champ une date de mise à jour. Par exemple, pour chaque fiche, on enregistre à côté de chaque donnée (nom, société, code postal, Siren, versement, etc) une date. C’est le type même de fichier « usine à gaz » ! Difficile de s’y retrouver tant les informations sont nombreuses.


A partir de combien de temps considère t-on un contact comme obsolète ?

La question est particulièrement difficile tant la réponse est corrélée à la typologie des données. En effet, un fichier d’adresses de lycéens se périme très rapidement. A contrario, le listing des anciens de l’école Polytechnique, promo 1946 a peu de chance de changer aussi vite ! Par ailleurs, l’usage d’une base de données aide à définir son obsolescence. Si vous utilisez chaque mois votre fichier pour un mailing, vos données seront mieux « tenues » que si vous réalisez un envoi en fin d’année bissextile ! Retenons que chaque année 13% des foyers déménagent que 12 à 14% des sociétés changent de numéro Siret (source Insee). A ce rythme, une base de données peut être complètement obsolète en seulement 8 ans.

 

 Objectif > 

Mettre en place un système simple et optimal d’enregistrement des dates de mise à jour et créer une date d’usage des données.

 

 Méthode > 

Phase A : Enregistrer la date de mise à jour

Comme on l’a vu plus haut, enregistrer une date de mise à jour pour tout un fichier est insuffisant ; le faire pour chaque champ et enregistrement est excessif. La juste mesure se situe sur chaque enregistrement en différenciant cependant les typologies de champs. Ainsi, il est conseillé d’avoir une date de mise à jour pour les quatre groupes de champs suivant :

  1. L’attribut d’un contact ou d’une société : patronyme, prénom, NIR, raison sociale, Siren, numéro de TVA intracommunautaire, numéro de compte, etc.

  2. Les données d’adressage postal et téléphonique : numéro de voie, voie, boite postale, code postal, commune, numéro de téléphone fixe, numéro de télécopie.

  3. Les données d’adressage numérique : courrier électronique et numéro de téléphone portable. Elles sont souvent plus volatiles, surtout pour les particuliers.

  4. Les données qualificatives : la date peut enregistrer tous les types de modifications liées à l’usage même de la base de données. Ce peut être un versement, une commande, une inscription, une référence de produit, un commentaire, etc. Attention, sur certaines bases de données dites « relationnelles » (ou SGBDR) ces données sont enregistrées dans un autre fichier relié par un identifiant (par exemple : le fichier des notes de frais est lié au fichier des contacts, lequel est lié au fichier des sociétés).
Forfait mailing
Normalisation
des adresses
postales

149

Infos

Phase B : Attribuer une date d’usage à vos données

On a vu que certains fichiers sont bien renseignés et à jour car souvent utilisés, même si les dates de mise à jour remontent à plusieurs années. Est-ce pour autant que les données sont mauvaises ? Pas toujours. Ainsi, l’astuce consiste à enregistrer dans chaque ligne de votre fichier la date de dernier usage.

Comment procéder ? C’est assez simple : à chaque fois que vous effectuez un mailing sur un groupe de personnes, vous enregistrez la date de cet envoi dans un champ « date d’usage ». La dernière date d’envoi annulant la précédente. Vous avez ainsi pour chaque contact, une date correspondant à l’actualisation des données et une autre mentionnant leur dernier usage. Une méthode infaillible pour sélectionner dans vos bases de données les contacts dont l’adresse est opérationnelle. A condition toutefois de bien enregistrer les retours de courrier non distribués (NPAI, pour N’habite Pas à l’Adresse Indiquée).

Comment valider les données obsolètes d’un fichier d’adresses ?

La méthode la plus simple consiste à confier votre fichier à un prestataire comme Datalgo qui pourra détecter certaines erreurs de saisie (voir ci-dessous). Vous pouvez aussi confier à un brooker spécialisé la vérification de chacune de vos adresses, contacts ou sociétés en les croisant avec son propre fichier ou en menant des enquêtes téléphoniques. Cette dernière méthode a un coût élevé. Or, il est souvent préférable de réaliser un mailing afin de remettre à jour votre « date d’usage » et de retirer les NPAI qui vous seront retournés.

 

 Solutions 
 Datalgo > 

Contrôler les contenus de vos bases de données

Datalgo propose des procédures de détections automatiques de données obsolètes ou incohérentes. Parmi celles-ci, on rencontre des traitements courants comme :

Ces traitements sont peu coûteux et permettent une détection rapide des erreurs de saisie.

Datalgo propose également un traitement de fusion de fichiers à partir des dates de mises à jour. Une solution pratique lorsqu'un même fichier a été copié en plusieurs exemplaires et mis à jour par plusieurs personnes.

 

 

 

 

 
Tous droits réservés
Le contenu de cette lettre d'information
ne saurait engager la responsabilité de Datalgo.

 

FORFAITS | Dédoublonnage | Vérification | Enrichissement | Conversion | Normalisation | Text mining | Structuration
 Contact | A propos de Datalgo | Chercher | Commander | © Datalgo