Datalgo

ConfidentialitéCommanderEntrepriseChercherContact

data cleaning

 Simplifiez la gestion de vos données


AccueilForfaits tout comprisDédoublonnageVérificationEnrichissementConversionNormalisationText miningStructuration

Dédoublonner 1 fichier | Dédupliquer 2 fichiers | Comparer 2 fichiers | Fusionner 2 fichiers

Accueil > Traitements > Dédoublonnage > Dédoublonner 1 fichier > Par similitude

Traitements
  Rubriques :
  Par contenu identique
  Par match-code
  Noms de société
  Noms de personnes
  Adresses
  Phonétique
  Par similitudes
 

Voir aussi :

  Forfait Dédoublonnage
Déduplication par similitude
Déduplication des noms de personnes
Déduplication des adresses
Déduplication par match-code
Déduplication phonétique
Déduplication par contenu identique
  Tous les traitements
Toutes nos infos
  Solutions :
 

Forfaits tout compris
  Par métiers
 

Datalgo :

  Tarifs et abonnements
  Fonctionnement
  Savoir faire
  Confidentialité
 

Newsletter :

 

Flash conseil gratuit

  S'abonner
  Consulter
 

Recherche rapide :

 

Dédoublonnage par similitude

Cet algorithme complexe analyse deux mots ou groupes de mots et attribue un pourcentage (score) de similitude entre les deux permettant de retrouver des doublons aux orthographes différentes au sein d'un même fichier.

Commande
À partir de 199euros

 Exemple de sociétés en double
 avec leur score de ressemblance
 Exemple d'adresses ressemblantes
 avec leur score
 Deux exemples de détection d'erreurs de saisie :
 Plaques d'immatriculation et SIRET
 

Ce traitement réalise des millions d'opérations permettant de comparer toutes les combinaisons d'un enregistrement avec toutes les données ressemblantes du même champ. Une note (scoring) attribue un pourcentage de ressemblance.

Ne sont généralement prises en compte que les données comprises entre 75% et 99% mais cette fonction évalue automatiquement le meilleur pourcentage pour suggérer un doublon possible allant parfois jusqu'à 90% et même 99% (suite).

Valeur ajoutée

Ce puissant outil de dédoublonnage vous permettra d'enrichir la qualité de vos fichiers, de réduire le temps consacré à sa mise à jour, de diminuer le coût de vos opérations marketing. Selon les fichiers, cette fonction permet de détecter de 5 à 30% de doublons dans un fichier. C'est autant d'économie pour la gestion de vos données.

Un traitement qui vous aidera à détecter les erreurs de saisie.

 

Commande
 Paramètres   Tarifs en euros   Offre groupée

Paramètre du bon de commandeComplétez les paramètres suivants sur le bon de commande :

 

Format du fichier : ______
Nom du fichier : ______
Nom du champ à dédoublonner : ______
Pour un seul traitement :
Référence Périodicité T1 T2 T3
PC101060 Ponctuel 199 388 577
Pour un traitement annuel régulier :
Référence Périodicité T1 T2 T3
AH101060 Hebdo 8874 17302 25729
AB101060 Bimensuel 4462 8700 12937
AM101060 Mensuel 2309 4503 6696

Choisissez vos tarifs...
en fonction du nombre de lignes dans votre fichier :
  T1  de 1 à 5.000 lignes
  T2  de 5.001 à 50.000
  T3  de 50.001 à 100.000
 Au dessus, tarif dégressif

Économisez 11% en choisissant un autre traitement sur le même fichier :

 

Dédoublonnage par similitude
+  Dédoublonnage par match-code
= 2 fonctions et 1 initialisation pour 316 (au lieu de 354€ jusqu'à 5000 lignes)

Bon de commande


En savoir plus

Forfait dédoublonnage
Dédoublonnage
ou
déduplication
Forfait tout compris
-20% à partir de

713€ 570

Infos

Cette fonction ne détruit ou ne fusionne aucune données de vos fichiers mais sélectionne les doublons que vous pouvez fusionner ou supprimer.

 

FORFAITS | Dédoublonnage | Vérification | Enrichissement | Conversion | Normalisation | Text mining | Structuration
 Contact | A propos de Datalgo | Chercher | Commander | © Datalgo