Il est très rare qu’une base de données puisse s’enorgueillir de
n’avoir pas de doublons. Les référentiels de contacts ou de sociétés
sont généralement les plus touchés par les doublons. Ces doublons
apparaissent selon deux cas de figure :
- un fichier a été importé dans la base de données et a
généré des fiches en double,
- un utilisateur a créé une nouvelle fiche sans vérifier
au préalable l’existence d’une fiche équivalente.
Ce deuxième cas est très fréquent sur les fichiers répertoriant,
par exemple, des sociétés ou des particuliers.

 |
Dédoublonnage
ou
déduplication |
| Forfait tout compris |
| -20%
à partir de |
|
713€ 570€
|
|
 |
|
|
Dans le cas de sociétés, un outil de gestion se doit de
proposer un contrôle
d’unicité au moment de la création d’une nouvelle fiche. Ainsi,
une alerte prévient l’utilisateur dès lors qu’il risque de créer un
doublon, sans pour autant bloquer la fiche d’une nouvelle société à
la raison sociale homonyme. Dans certains cas, l'outil prend
également en compte les
raisons
sociales approchantes (Ex : Fargot SARL et Société Fargot) ou
les patronymes ayant
la même phonétique (Ex : Schmitt et Schmidt).
Malheureusement, ce contrôle n’est pas infaillible
et pas toujours applicable. C'est le cas par exemple des réseaux
de franchisés ou des offices notariaux. Dans un cas, l’enseigne
diffère de la raison sociale, dans l’autre, le nombre de notaires
présents dans une même étude rend aléatoire le contrôle.
Certaines organisations obligent leurs collaborateurs à
saisir un
numéro de Siret pour toute nouvelle création de société. Un
contrôle d’unicité dans l’outil de gestion permet automatiquement
d’alerter l’utilisateur avant qu’il créé un doublon de Siret.
Ceci étant dit, cette contrainte n’est pas toujours possible et
freine parfois la démarche commerciale. En effet, peu de clients ou
de prospects connaissent par cœur les quatorze chiffres qui
composent le numéro d’enregistrement au registre du commerce. De
plus, cette contrainte n’est pas possible pour des sociétés
immatriculées à l’étranger, qui ne possèdent pas les mêmes
codifications. Certaines sociétés dont le périmètre de clientèle est
circonscrit à l’Union européenne ont tenté de placer un contrôle
d’unicité sur le numéro de
TVA Intracommunautaire,
malheureusement, bien qu’obligatoire en Europe, ce numéro est
aujourd’hui très difficile à obtenir.
Dans le cas de fichiers de particuliers, l’opération
est tout aussi délicate. Les couples mariés ou divorcés viennent
perturber le repérage automatique de doublons. La présence ou
l’absence de prénoms, ou l’enregistrement du prénom du mari pour
l’épouse complexifie également la
déduplication.
En somme, la création de doublons se fait naturellement
et ne peut être contrôlée automatiquement avec 100% de réussite. La
détection de doublons à
postériori, par exemple lors de traitement en masse n’a pas non
plus un score de
réussite parfait.
En conséquence, la plupart des administrateurs de base
de données sont amenés à fusionner manuellement leurs données.
Ils choisissent entre les deux fiches en double celle qu’ils veulent
conserver et recopient, généralement champ par champ, les données
manquantes. Par exemple, deux sociétés créées en double devront
nécessiter le dédoublonnage d’une des sociétés et le rapatriement
sur une seule fiche de toutes les commandes déjà réalisées,
et/ou de tous les contacts identifiés dans la société. Un travail
pas toujours facile et générateur d’erreurs.
|