Datalgo

ConfidentialitéCommanderEntrepriseChercherContact

data cleaning

 Simplifiez la gestion de vos données


AccueilForfaits tout comprisDédoublonnageVérificationEnrichissementConversionNormalisationText miningStructuration

Audit | Fichier commercialMailing adresses | Données ressources humaines | Dédoublonnage | Text mining

Accueil > Forfaits > Audit de fichier

Forfaits tout compris
Avec ce forfait d'audit plus de soucis pour contrôler et optimiser vos bases de données.
Toutes nos infos
  Solutions :
 

Forfaits tout compris
  Par métiers
 

Datalgo :

  Tarifs et abonnements
  Fonctionnement
  Savoir faire
  Confidentialité
 

Newsletter :

 

Flash conseil gratuit

  S'abonner
  Consulter
 

Recherche rapide :

 

Audit complet d'une base de données

Diagnostic détaillé champ par champ de votre base de données ou de votre fichier afin de déterminer les points forts et les faiblesses de son contenu.

Commande
À partir de 59euros

 

Valeur ajoutée

Vous recevez un rapport détaillé de votre fichier vous permettant immédiatement de mettre en œuvre des traitements correctifs sur les données en doubles, erronées ou non normalisées. Une synthèse graphique permet d'avoir un aperçu facilement compréhensible du contenu.

 
Cet audit m'a permis de détecter des erreurs importantes dont j'ignorais même qu'elles puissent arriver. J'ai pu ainsi concentrer mes correctifs sur les 220 fiches qui posaient vraiment problème, ce qui m'a évité une revue en détail des 15 000 enregistrements de ma base !

Cet audit de fichier a pour objet de réaliser une analyse détaillée de chaque champ afin de vous permettre d'effectuer des ajustements sur vos données : corrections, fusions, suppressions, ajouts, etc.

Voir un exemple 

Ce rapport présente en amont une synthèse graphique de votre fichier permettant de comprendre immédiatement les points forts et points faibles de votre base de données.

Cliquez sur le tableau pour visualiser un exemple d'analyse

Pour chaque champ, Datalgo réalise un comptage et une analyse des contenus.

  • Les comptages sur le format, les doublons et la qualité permettent de connaître avec exactitude les paramètres de chaque champ.

  • Un feu tricolore mesure simplement l'état de vos données : tout va bien (vert), améliorations possibles (orange) ou danger (rouge).

  • Des commentaires ajoutent une explication aux différents comptages.

  • Lorsque cela s'impose, Datalgo vous fournit des conseils pour optimiser la qualité de vos données, voir réduire les coûts d'exploitation. Ces conseils sont précédés d'une icône représentant un point d'exclamation dans un carré.

  • Dans certains cas, Datalgo vous propose de réaliser des traitements spécifiques qui vous aideront à effectuer les bons correctifs sur votre base de données.

  • Quand cela est nécessaire, Datalgo vous signale que votre fichier devrait éventuellement faire l'objet d'une déclaration à la CNIL.

Pour chaque champ, quels sont les comptages et analyses réalisés dans le rapport d'audit ?

FORMAT :

- Nombre d'enregistrements renseignés (exhaustivité) : détermine la proportion d'enregistrements renseignés par opposition à des enregistrements restés vides de toute information.

- Nombre d'enregistrements numériques : établit un ratio entre les informations numériques ou textuelles. Cela permet dans bien des cas de détecter des erreurs de saisie : texte dans un champ numérique et réciproquement.

- Ratio Loi de Benford : cette loi permet de vérifier qu'un champ de données numériques contient bien des valeurs numériques aléatoires (chiffres d'affaire, métrages, quantités…) Fréquemment utilisée pour l'audit comptable, cette loi démontre qu'un ratio supérieur à 10% est peut-être le signe qu'il y a des erreurs ou même des irrégularités dans vos données.

- Largeur du champ : précise le nombre maximum de caractères contenus dans ce champ. Cette information permet souvent de formater au plus juste un système de gestion de base de données afin d'optimiser la taille des fichiers… et la rapidité des sauvegardes.

DOUBLONS STRICTS :

- Nombre d'enregistrements strictement uniques : affiche 100% lorsqu'il n'y a aucun doublon.

- Nombre de doublons stricts : précise le nombre de doublons stricts (c'est-à-dire contenant des valeurs absolument identiques).

- Nombre total d'enregistrements affectés par les doublons : calcule le nombre de fiches concernées par ces doublons dans votre base de données.

- Nombre maximum d'enregistrements répétés : précise s'il s'agit de doublons (2 fiches identiques), triplons (3 fiches identiques), quadruplons (4 fiches identiques), etc.

DOUBLONS APPROCHANTS :

- Nombre de doublons approchants : précise le nombre de doublons dont les valeurs sont ressemblantes mais pas forcément identiques.

- Nombre total d'enregistrements affectés par les doublons : calcule le nombre de fiches concernées par ces doublons approchants dans votre base de données.

- Nombre maximum d'enregistrements répétés : précise s'il s'agit de doublons (2 fiches ressemblantes), triplons (3 fiches), quadruplons (4 fiches), etc.

QUALITÉ :

- Nombre d'enregistrements hors normes : certaines données doivent être normalisées, soit pour être présentées correctement et facilement déduplicables, soit pour réduire les coûts d'affranchissement lorsqu'il s'agit d'adresses postales.

- Nombre d'erreurs (code ou donnée erronée) : pour certains types de données, il est possible de vérifier le contenu via un algorithme (mauvais numéro SIREN, TVA Intracommunautaire, numéro de sécurité sociale, nomenclature d'activité, etc).

 

Comment procéder ? Il vous suffit tout simplement de nous envoyer votre fichier dans un format courant. Vos données peuvent concerner des sociétés, des salariés, des produits, etc. Elles seront traitées en toute confidentialité.

 

Commande
 Paramètres   Tarifs en euros   Offre groupée

Paramètre du bon de commandeComplétez les paramètres suivants sur le bon de commande :

 

Format du fichier : ______
Nom du fichier : ______
Pour un seul traitement :
Référence Périodicité T1 T2 T3
PC901005 Ponctuel 59 115 171
Pour un traitement annuel régulier :
Référence Périodicité T1 T2 T3
AH901005 Hebdo 2631 5128 7625
AB901005 Bimensuel 1323 2579 3834
AM901005 Mensuel 685 1335 1985

Choisissez vos tarifs...
en fonction du nombre de lignes dans votre fichier :
  T1  de 1 à 5.000 lignes
  T2  de 5.001 à 50.000
  T3  de 50.001 à 100.000
 Au dessus, tarif dégressif

Économisez 6% en choisissant un autre traitement sur le même fichier :

 

Audit complet d'une base de données
+  Vérification et normalisation d'un fichier d'adresses en 7 points
= 2 fonctions et 1 initialisation pour 556 (au lieu de 594€ jusqu'à 5000 lignes)

Bon de commande

o o o

Flash Datalgo : L’étonnante loi de Benford détecte les irrégularités dans vos fichiers 15-02-2005
Cette méthode facile à mettre en œuvre permet de détecter d’éventuelles irrégularités dans une base de données comptables ou dans n’importe quel fichier comportant des valeurs numériques aléatoires. Lire

 

 

FORFAITS | Dédoublonnage | Vérification | Enrichissement | Conversion | Normalisation | Text mining | Structuration
 Contact | A propos de Datalgo | Chercher | Commander | © Datalgo