|
Cet audit de fichier a pour objet de réaliser une analyse
détaillée de chaque champ afin de vous permettre d'effectuer des ajustements sur vos données : corrections, fusions, suppressions,
ajouts, etc.
Ce rapport présente en amont une synthèse graphique de votre fichier permettant de comprendre immédiatement les points forts et points faibles de votre base de données.

Pour chaque champ, Datalgo réalise un comptage et une analyse des contenus.
- Les comptages sur le format, les doublons et la qualité permettent de connaître avec exactitude les paramètres de chaque champ.
Un feu tricolore
mesure simplement l'état de vos données :
tout va bien (vert), améliorations possibles (orange) ou danger (rouge).
- Des commentaires ajoutent une explication aux différents comptages.
Lorsque cela s'impose, Datalgo vous fournit des conseils pour optimiser la qualité de vos données, voir réduire les coûts d'exploitation. Ces conseils sont précédés d'une icône représentant un point d'exclamation dans un carré.
- Dans certains cas, Datalgo vous propose de réaliser des traitements spécifiques qui vous aideront à effectuer les bons correctifs sur votre base de données.
- Quand cela est nécessaire, Datalgo vous signale que votre fichier devrait éventuellement faire l'objet d'une déclaration à la CNIL.
Pour chaque champ, quels sont les comptages et analyses
réalisés dans le rapport d'audit ?
FORMAT :
- Nombre d'enregistrements renseignés (exhaustivité) : détermine la proportion d'enregistrements renseignés par opposition à des enregistrements restés vides de toute information.
- Nombre d'enregistrements numériques : établit un ratio entre les informations numériques ou textuelles. Cela permet dans bien des cas de détecter des erreurs de saisie : texte dans un champ numérique et réciproquement.
- Ratio Loi de Benford : cette loi permet de vérifier qu'un champ de données numériques contient bien des valeurs numériques aléatoires (chiffres d'affaire, métrages, quantités…) Fréquemment utilisée pour l'audit comptable, cette loi démontre qu'un ratio supérieur à 10% est peut-être le signe qu'il y a des erreurs ou même des irrégularités dans vos données.
- Largeur du champ : précise le nombre maximum de caractères contenus dans ce champ. Cette information permet souvent de formater au plus juste un système de gestion de base de données afin d'optimiser la taille des fichiers… et la rapidité des sauvegardes.
DOUBLONS STRICTS :
- Nombre d'enregistrements strictement uniques : affiche 100% lorsqu'il n'y a aucun doublon.
- Nombre de doublons stricts : précise le nombre de doublons stricts (c'est-à-dire contenant des valeurs absolument identiques).
- Nombre total d'enregistrements affectés par les doublons : calcule le nombre de fiches concernées par ces doublons dans votre base de données.
- Nombre maximum d'enregistrements répétés : précise s'il s'agit de doublons (2 fiches identiques), triplons (3 fiches identiques), quadruplons (4 fiches identiques), etc.
DOUBLONS APPROCHANTS :
- Nombre de doublons approchants : précise le nombre de doublons dont les valeurs sont ressemblantes mais pas forcément identiques.
- Nombre total d'enregistrements affectés par les doublons : calcule le nombre de fiches concernées par ces doublons approchants dans votre base de données.
- Nombre maximum d'enregistrements répétés : précise s'il s'agit de doublons (2 fiches ressemblantes), triplons (3 fiches), quadruplons (4 fiches), etc.
QUALITÉ :
- Nombre d'enregistrements hors normes : certaines données doivent être normalisées, soit pour être présentées correctement et facilement déduplicables, soit pour réduire les coûts d'affranchissement lorsqu'il s'agit d'adresses postales.
- Nombre d'erreurs (code ou donnée erronée) : pour certains types de données, il est possible de vérifier le contenu via un algorithme (mauvais numéro SIREN, TVA Intracommunautaire, numéro de sécurité sociale, nomenclature d'activité,
etc). Comment procéder ?
Il vous suffit tout simplement de nous envoyer votre fichier dans un
format courant. Vos données peuvent concerner des sociétés, des salariés, des produits, etc.
Elles seront traitées en toute confidentialité. |