Datalgo

ConfidentialitéCommanderEntrepriseChercherContact

data cleaning

 Simplifiez la gestion de vos données


AccueilForfaits tout comprisDédoublonnageVérificationEnrichissementConversionNormalisationText miningStructuration

Votre métier Marketing & commercial | Ressources humaines | Finance | Communication | Juridique | Associations

Accueil > Flash conseils > Consulter > Flash du 15-07-2010

Toutes nos infos
  Solutions :
 

Forfaits tout compris
  Traitements à la carte
  Par métiers
 

Datalgo :

  Tarifs et abonnements
  Fonctionnement
  Savoir faire
  Confidentialité
 

Newsletter :

 

Flash conseil gratuit

  S'abonner
  Consulter
 

Recherche rapide :

 

Enrichir ses fichiers d’entreprises

15-07-2010 • L’offre d’enrichissement des fichiers d’entreprises est abondante. Chaque fournisseur propose ses informations. Pour autant, la plupart des données proviennent d’une source unique, la base Insee qui propose un large éventail d’informations de qualité et de récence variable.

 Constat > 

La plupart des organisations possèdent des fichiers d’entreprises, soit qu’il s’agisse de clients, de prospects ou de fournisseurs. Dans tous les cas, la qualité de l’information sur les entreprises est essentielle pour répondre à trois principaux objectifs : identifier avec certitude les doublons, avoir des adresses à jour et pouvoir utiliser les données à des fins d’analyse par segmentations.
Vérification des codes SIREN
SIREN
Vérifiez vos codes
à partir de

69

Infos

L’identification des doublons par le Siret

L’identification des doublons est le plus souvent réalisable par l’intermédiaire de l’identifiant unique utilisé par toutes les structures françaises, commerciales ou associatives : le Siret. Composé d’un Siren sur 9 chiffres qui identifie l’entreprise, on lui adjoint un code NIC sur 5 caractères (lié à l’adresse de l’établissement), l’ensemble constituant le numéro unique SIRET. Un fichier client qui ne possède pas de Siret peut être « rapproché » des données Insee afin d’en identifier les Siret.

Les adresses

L’adressage des sociétés est essentiel pour la vie du fichier. En effet, comment entrer en contact avec un client, un prospect ou un fournisseur sans ses coordonnées ?

Les données de segmentation

Le nom de l’entité, son code Siret et son adresse ne suffisent généralement pas pour réaliser de la segmentation de données. En effet, il est généralement nécessaire de pouvoir classer ses données selon différents critères qualifiant la nature de l’entreprise : zones géographiques, performances financière, statut juridique, activité, etc.

 

 Objectif > 

Identifier les informations standards sur les entreprises

 

 Méthode > 

Indices de cotation
Bourse de Paris
Indices
de cotation français
à partir de

89

Infos

L’Insee capitalise l’ensemble des informations recueillies dans le Registre du Commerce et des Sociétés, le RCS. Mais en plus de collecter l’information existante, l’Insee réalise des Enquêtes Annuelles auprès des Entreprises (EAE) afin d’apporter des données complémentaires utiles pour la segmentation des données. Le fichier Insee des entreprises possède environ quatre-vingts types d’informations utilisables pour mieux comprendre l’entreprise. Ces données sont proposées dans un fichier unique appelé couramment « Notice 80 ».

Un fichier exhaustif mais avec deux défauts importants

Avant de vouloir utiliser les données de l’Insee, il convient d’en connaître les limites ; bien que représentant l’ensemble des entreprises françaises, ce fichier souffre de deux principaux défauts :

  • Si toutes les sociétés sont référencées, elles n’ont pas toutes la même qualité d’information, en particulier lorsqu’il s’agit de données économiques. En effet, certaines entreprises préfèrent payer une amende plutôt que de déclarer leur chiffre d’affaires !
     

  • La mise à jour de certains champs subit parfois un décalage important dans le temps : certaines données économiques (comme le CA) sont collectées lors d’enquêtes réalisées deux ans plus tôt et qui portent sur l'exercice comptable N-3.


Malgré tout, le fichier de l’Insee est intéressant car il présente un grand nombre de variables réunies en quatre parties principales :

  • L’identification de la société,

  • La localisation géographique de l’établissement,

  • Les caractéristiques économiques de l’établissement,

  • Les caractéristiques économiques de l’entreprise.

On notera ici que l’Insee distingue bien l’entreprise de l’établissement : « Un établissement est une unité d'exploitation ou de production localisée géographiquement, individualisée mais dépendant juridiquement d'une entreprise. La création d'une entreprise est toujours associée à la création d'au moins un établissement, le siège. »

L’identification de la société

Cette partie contient principalement : le numéro Siret, le nom ou la raison sociale de l'entreprise, l’adresse complète.
Notons que la longueur des adresses ne dépasse plus désormais la norme postale des 38 caractères.

La localisation géographique de l’établissement

La région de localisation permet d’utiliser différentes échelles géographiques : région, département, arrondissement, canton, commune, etc.

Les caractéristiques économiques de l’établissement

Cette partie apporte principalement des informations structurelles : activité (code APE sous la forme NAF en 5 caractères, ainsi que ses sous-activités si elles existent), siège ou établissement, effectif (et sa date de mise à jour), date de création. Les tranches d'effectifs sont issues des sources URSSAF et des Déclarations Annuelles de Données Sociales (DADS).

Les caractéristiques économiques de l’entreprise

On trouvera ici le nom de l’entreprise, son sigle éventuel, la civilité (M. ou Mme pour les entrepreneurs particuliers), l’effectif, l’activité principale, le chiffre d’affaire et son année de validité, la date de création de l’entreprise, les différentes activités de l’entreprise, et enfin la localisation du siège de l’entreprise.
 

Enfin, un dernier champ précise la date nature des mises à jour des données : création d’établissement, suppression, modification.

A l’aide de l’ensemble de ces données, il est possible de réaliser des sélections d’entreprises ou d’établissements et de tenir à jour ses fichiers clients ou fournisseurs.

 

 

 Solutions 
 Datalgo > 

Faites réaliser les traitements nécessaires pour vos fichiers

Datalgo vous propose l'enrichissement de vos fichiers en Siret (Siretisation) et la qualification à partir des données de la notice 80.

Consultez-nous pour vos demandes plus précises ou complexes.

 

 
Tous droits réservés
Le contenu de cette lettre d'information
ne saurait engager la responsabilité de Datalgo.

 

FORFAITS | Dédoublonnage | Vérification | Enrichissement | Conversion | Normalisation | Text mining | Structuration
 Contact | A propos de Datalgo | Chercher | Commander | © Datalgo