Datalgo

ConfidentialitéCommanderEntrepriseChercherContact

data cleaning

 Simplifiez la gestion de vos données


AccueilForfaits tout comprisDédoublonnageVérificationEnrichissementConversionNormalisationText miningStructuration

Votre métier Marketing & commercial | Ressources humaines | Finance | Communication | Juridique | Associations

Accueil > Flash conseils > Consulter > Flash du 15-05-2006

Toutes nos infos
  Solutions :
 

Forfaits tout compris
  Traitements à la carte
  Par métiers
 

Datalgo :

  Tarifs et abonnements
  Fonctionnement
  Savoir faire
  Confidentialité
 

Newsletter :

 

Flash conseil gratuit

  S'abonner
  Consulter
 

Recherche rapide :

 

Transformer sa base de données pour faciliter sa gestion de contacts

15-05-2006 • Prévoir ou améliorer la structure de son outil de gestion de données permet d'optimiser son contenu tout en réduisant les coûts de routage.

 Constat > 

Dans l'histoire d'une entreprise ou d'une association, l'origine du fichier des contacts est souvent la même : dans les premiers mois d'activité, le fichier est administré sur un tableur (Excel par exemple). Lorsque celui-ci ne répond plus aux besoins opérationnels de l'organisation, on le remplace par un système de gestion de base de données (SGBD). Dans certains cas, on fait appel à un logiciel dédié pour ce besoin (progiciel), dans d'autres, on utilise une application permettant de développer et de personnaliser sa base de données : FoxPro, Access, Dbase, FileMaker, 4D, MySQL, etc...

Pourquoi définir des champs avant de construire sa base de données ?

Un outil de gestion de données se conçoit en amont, devant une feuille de papier, plutôt que devant un ordinateur ! Ce processus qualité, est à l'image d’un édifice : l’architecture d’un outil de gestion de données se dessine avant la pose de la première pierre. Au cours de cette étape décisive, on y précise les objectifs, les fonctionnalités, ce que l'on souhaite obtenir, etc. C'est à ce moment que l'on définit la liste précise des champs avec leurs propriétés. Chaque champ enregistre un type d’information répété sur chaque fiche. La définition des champs correspond aux fondations de l'édifice. On ne peut facilement ajouter de nouveaux champs s'ils n'ont pas été prévus sur plan au départ.

Forfait dédoublonnage
Dédoublonnage
ou
déduplication
Forfait tout compris
-20% à partir de

713€ 570

Infos

Quels sont les cinq impacts majeurs d'une mauvaise définition préalable des champs ?

  1. La recherche ou le tri des données sont rendus périlleux, ce qui souvent occasionne la création de doublons,
     
  2. L'affichage des informations est confus et génère des erreurs d'interprétation,
     
  3. Les tarifs postaux les plus avantageux ne peuvent s'appliquer qu'à condition d'avoir des adresses normalisées,
     
  4. L'analyse et la segmentation des informations n'est pas fiable. Comment, par exemple, sélectionner les données d'un département si le code postal n'est pas saisi correctement ?
     
  5. Les utilisateurs sont démotivés par l'outil et les données qui ne répondent plus à leurs attentes.

     

Les erreurs les plus fréquentes dans la construction de la base de données

  • Identifiant : lorsqu'il n'existe pas un numéro ou un code unique pour identifier chaque contact, la gestion de la base de données risque fort de trouver ses limites dès que le volume prend de l'importance ou lorsque des doublons viennent polluer le contenu.
     
  • Les noms et prénoms : ils sont confondus dans le même champ. Dans ce cas, il est pratiquement impossible de réaliser un tri par ordre alphabétique.
     
  • Les sociétés : leurs raisons sociales ou enseignes sont mélangées avec les noms et prénoms des contacts, ce qui rend les sélections et tris quasi-impossibles.
     
  • La civilité : elle n'est pas déterminée ou isolée ; cela rend difficile la rédaction de courriers personnalisés.
     
  • Les adresses : elle ne sont pas normalisées, c'est-à-dire qu'elles sont la plupart du temps trop longues et ne sont pas acceptées aux tarifs les plus avantageux par les services postaux.
     
  • Les codes postaux : souvent, lorsqu'ils sont récupérés depuis une feuille Excel au format numérique, ils sont abrégés ce qui les rend inopérants (le code "02100" pour Saint Quentin devient "2100", et le "06400" pour Cannes se transforme en "6400").
     
  • Les villes et pays : mélangés au sein d'un même champ, ils ne permettent pas un routage correct du courrier à destination de l'étranger. Lorsque les pays ne sont pas normalisés, ils peuvent empêcher une bonne sélection (par exemple, ce même pays peut connaître plusieurs libellés : United Kingdom, UK, Royaume Uni, Angleterre, Grande Bretagne).
     
  • Les téléphones : les numéros de portable, de télécopie et de fixe sont mélangés, rendant ainsi plus difficile l’usage, le croisement, l'enrichissement ou la déduplication de données.
     
  • Les fonctions : dans une entreprise, le titre précis d'une fonction peut être libellé de multiples manières alors qu'il s'agit souvent d'une même fonction. Ainsi, le directeur financier pourra avoir plusieurs appellations : DAF, Directeur Financier, Dir Adm et Finances, CFO, Directeur Financier Europe, Chief Financial Officer, etc.
     
  • Les emails : si leur saisie n'est pas contrôlée, on risque de rencontrer des emails impossibles à utiliser (par exemple, les accents sur les lettres empêchent le routage correct des courriels).
     
  • Les retours : l'enregistrement des retours (ou NPAI, pour N'habite Pas à l'Adresse Indiquée) ne sont pas prévus.
     
  • La loi informatique et libertés : rien n'est prévu pour se mettre en conformité avec la loi protégeant les individus sur l'enregistrement de leurs données personnelles. Or, en France, toute base de données qui enregistre des données personnelles, quels que soient sa taille et son usage, doit se plier à la loi Informatique et Libertés.


De telles erreurs peuvent non seulement perturber la bonne distribution du courrier, mais en plus générer des doublons et des erreurs de traitements préjudiciables.

En prévoyant à l'avance les champs nécessaires pour votre base, vous vous épargnez un avenir douloureux : restructurations, enrichissements, corrections, normalisations...

 

 Objectif > 

Définir la nature et les propriétés des champs de saisie dans une base de données

 

 Méthode > 

Forfait mailing
Normalisation
des adresses
postales

149

Infos

Datalgo présente ici une solution "minimale", c'est-à-dire les champs absolument nécessaires pour une bonne gestion d'adresses et de contacts. Il est certain qu'en fonction des besoins et du volume de données, des paramètres supplémentaires devront être prévus.

En France, La Poste impose 6 règles d'or pour la rédaction des adresses et donc le bon routage du courrier :

1ère règle : des informations ordonnées du nominatif (nom et/ou raison sociale) jusqu'à la localité (ville) du destinataire.

2ème règle : 6 lignes maximum. Les lignes blanches sont à supprimer.

3ème règle : chaque ligne comporte 38 caractères ou espaces maximum, un espace doit figurer entre chaque mot.

4ème règle : aucun signe de ponctuation, de souligné, d’italique à partir de la ligne 4 « numéro et libellé de voie ».

5ème règle : la dernière ligne est toujours en majuscules (les trois dernières fortement conseillées).

6ème règle : le pavé adresse est aligné à gauche.
 

A partir des points énoncés par les services postaux ci-dessus, voici les 19 champs incontournables pour votre base de données :

Champ Exemple Description
Identifiant 13432 A chaque nouvel enregistrement, un numéro supplémentaire est créé automatiquement. Il permet d'enregistrer et de retrouver un contact avec plus de certitude, et surtout, il est indispensable pour les futurs traitements qui pourraient être réalisés : enrichissement, dédoublonnage, gestion des retours courrier, etc.
Société Mag Presse SA Prévoyez un champ avec suffisamment de caractères pour les raisons sociales (elles peuvent aller jusqu'à 100 caractères, mais 38 caractères est une norme acceptable). Vous pouvez prévoir aussi un autre champ facultatif pour le sigle ou l'enseigne.
Civilité Mme Normalisez la saisie à partir d'une table de référence : "M.", "Mme", "Mlle" est un minimum.
Prénom Frédérique Il est préférable de rendre ce champ obligatoire, mais ce n'est pas toujours possible.
Nom Marchand Donnez-vous une règle de saisie pour les patronymes avec particule afin d'éviter des affichages différents : "De Marnes" ou "de Marnes" ou "Marnes (de)". Lorsque la particule est en fin de mot, le tri par ordre alphabétique est plus pratique. Si possible, rendez ce champ obligatoire.
Fonction Directeur général Il est recommandé de normaliser les fonctions à partir d'une table précodifiée. Cela facilite le ciblage et l'extraction de données par fonctions (cf. supra). On pourra éventuellement prévoir un champ facultatif pour l'enregistrement de la fonction officielle (celle affichée sur la carte de visite du contact).
Adresse 1 Bâtiment 21 Généralement, on enregistre le numéro de boîte aux lettres ou d’appartement, l'escalier, l'étage lorsqu'il s'agit d'un particulier ; et l'entrée, la tour, l'immeuble, le bâtiment, la résidence, la zone industrielle lorsqu'il s'agit d'une société... On attribue un format rigoureux pour l'ensemble des champs d'adressage : saisie de préférence en majuscule sans accent, sans ponctuation, pas de lignes dépassant 38 caractères.
Adresse 2 3 rue Lacan Cette ligne enregistre généralement le numéro de voie, le type (rue, avenue...) et le nom de la voie (elle a le même format que l'adresse 1)
Adresse 3 BP 12 Mention de distribution (BP, poste restante) suivie du libellé de la localité de destination dans le cas où celle-ci serait différente du libellé cedex.
Code postal 92800 Il ne doit jamais être enregistré au format numérique, mais bien au format texte (cf. supra). En France il est toujours sur 5 caractères. Il est essentiel pour segmenter géographiquement votre fichier et réaliser un routage à tarif préférentiel.
Ville PUTEAUX Elle ne doit pas dépasser les 32 caractères et doit toujours être saisie en majuscule sans accent. On lui adjoint parfois un code cedex et libelle cedex.
Pays FRANCE On pourra par défaut mettre "FRANCE". Quelque soit le pays, il est important de l'enregistrer en majuscule. Si possible, on fera appel à une table de référence avec une liste de pays normalisés.
Téléphone fixe 01 47 89 34 12 Enregistrez la numérotation au format texte (le format numérique risque de faire disparaître le préfixe zéro, ou pire, de transposer les numéros en chiffres exponentiels !)
Télécopie 01 47 89 34 10 Idem
Téléphone mobile 06 20 99 66 12 Idem
Email frederiquem@free.fr Si possible, ajoutez un contrôle au moment de la saisie pour supprimer les caractères diacritiques ("ç", "é", "ï", etc) et imposer la présence d'un arobase.
Retour erroné Non Une case à cocher (Oui/Non) peut suffire dans un premier temps pour enregistrer les NPAI (N'habitude Plus à l'Adresse Indiquée). Elle permet de savoir que les coordonnées d'un contact sont erronées.
Permission Oui Une case à cocher permet de se mettre en conformité avec la loi Informatique et Libertés. Si la case est cochée "Non", vous pouvez conserver ce contact, mais vous ne devez plus le solliciter par email ou courrier.
Date de MAJ 02/11/2005 Enregistrement de la date de mise à jour au format "date". Ce champ devra s'actualiser automatiquement dès qu'une modification sera réalisée sur la fiche du contact. Il est essentiel pour gérer la qualité de vos contenus.


En respectant cette solution minimum, vous facilitez la gestion de vos fichiers. En outre, pour des envois en nombre, vous bénéficiez de tarifs postaux préférentiels.


 

 

 Solutions 
 Datalgo > 

Faites réaliser la normalisation et l'enrichissement de votre base de données

Datalgo propose une multitude de solutions pour préparer son fichier afin de rendre son contenu optimal dans une base de données :

Consultez-nous pour vos demandes plus précises ou complexes.

 

 
Tous droits réservés
Le contenu de cette lettre d'information
ne saurait engager la responsabilité de Datalgo.

 

FORFAITS | Dédoublonnage | Vérification | Enrichissement | Conversion | Normalisation | Text mining | Structuration
 Contact | A propos de Datalgo | Chercher | Commander | © Datalgo