Datalgo

ConfidentialitéCommanderEntrepriseChercherContact

data cleaning

 Simplifiez la gestion de vos données


AccueilForfaits tout comprisDédoublonnageVérificationEnrichissementConversionNormalisationText miningStructuration

Votre métier Marketing & commercial | Ressources humaines | Finance | Communication | Juridique | Associations

Accueil > Flash conseils > Consulter > Flash du 15-11-2010

Toutes nos infos
  Solutions :
 

Forfaits tout compris
  Traitements à la carte
  Par métiers
 

Datalgo :

  Tarifs et abonnements
  Fonctionnement
  Savoir faire
  Confidentialité
 

Newsletter :

 

Flash conseil gratuit

  S'abonner
  Consulter
 

Recherche rapide :

 

Le casse-tête des nomenclatures d’activités

15-11-2010 • Fusionner des fichiers sectoriels européens et américains est toujours une vrai difficulté tant les codifications de chaque continent sont encore éloignées.

 Constat > 

Forfait mailing
Normalisation
des adresses
postales

149

Infos

Nombreuses filiales françaises de groupes américains voudraient automatiquement accorder les secteurs d’activités de leurs fichiers clients. Les normes semblent complexes et discordantes de chaque côté de l’Atlantique. Ainsi, si vous souhaitez automatiquement trouver les équivalences entre les codes NAF de vos données clients français pour les intégrer aux codes NAICS américains, vous allez rapidement vous heurter à des situations particulièrement complexes. En effet, la France est passée depuis le 1er janvier 2008 à une nouvelle codification des activités des entreprises. De fait, la précédente nomenclature ne possédait « que » 712 codification, alors que celle en vigueur – la NAV révision 2 – en détient 732, qui plus est, sur 5 caractères au lieu de 4 ! Par exemple, le code 714B (location d'autres biens personnels et domestiques) s’est divisé en trois nouveaux codes : 7721Z, 7722Z et 7729Z.

Cette nouvelle nomenclature française s’appuie en réalité sur la nomenclature européenne appelée : NACE révision 2. Tant mieux ! Sauf que cette nouvelle norme n’est plus compatible avec la norme américaine appelée NAICS. Car les pays d’Amérique du nord (Mexique, Canada et Etats-Unis) font également évoluer leurs nomenclatures… Officiellement, les américains avaient abandonné la codification SIC pour la NAICS (appelée aussi Système de classification des industries de l'Amérique du Nord – SCIAN). La version 2002 du NAICS permettait de réaliser sans trop de casse des liens avec la codification NACE européenne (version 1.1). Malheureusement, les Américains sont passés depuis 2007 à une nouvelle version incompatible avec la version européenne récente (NACE révision 2)… et devraient d’ici 2012 adopter encore une nouvelle version !

On ne cherchera pas ici à savoir qui a tord ou a raison. En réalité, chaque continent compose avec ses propres difficultés, tout en s’efforçant de suivre les recommandations d’une troisième norme, celle-ci vraiment internationale, appelée CITI (Classification internationale type par industries, ou ISIC en Anglais) promue par les Nations unies depuis 1948. Cette nomenclature est tenue d’inspirer les différents continents pour que chaque codification locale s’approche de plus en plus d’un standard global. Cette classification de la CITI, dans sa quatrième version depuis 2006, est le résultat d’un processus de révision qui s’étend sur plusieurs années avec la participation de nombreux spécialistes et utilisateurs de la nomenclature dans le monde entier. Dans la mesure du possible, les systèmes de codification de la CITI et de la NACE sont donc assez proches… sauf, lorsqu’on arrive à un certain niveau de détail. Et c’est bien là qu’est le problème, car chaque entreprise est naturellement qualifiée par son niveau d’activité le plus détaillé. Il est donc possible qu’une codification pour une activité spécifique soit différente entre l’Europe, l’Amérique et les Nations Unies.

 

 Objectif > 

Trouver une codification commune transatlantique pour les activités des sociétés.

 

 Méthode > 

La codification universelle des codes d’activité des entreprises n’est pas pour aujourd’hui tant est long et complexe le système qui permet d’unifier les nomenclatures de chaque pays. Cependant, la véritable question à se poser est de savoir pourquoi vouloir unifier les codifications dans une base internationale ?

Les avantages d’une codification unie sont les suivants : il n’y a plus qu’un seul champ à gérer dans lequel mettre l’information ; les analyses statistiques entre les pays, et donc la consolidation par activités, se révèle beaucoup plus facile.

Inconvénient : il n’existe pas de fournisseur de base de données capable de vous attribuer un code d’activité unique pour toutes les entreprises de la planète. En France, l’Insee ne vous fournira que le code NAF (révision 2) appelée parfois APE, malgré tout directement engendré par la logique de la nomenclature NACE européenne. Mais au Canada, au Mexique ou aux États-Unis, cette codification n’existe pas !

Forfait dédoublonnage
Dédoublonnage
ou
déduplication
Forfait tout compris
-20% à partir de

713€ 570

Infos

Solution 1 : utiliser une codification internationale

La société Dun & Bradstreet a développé depuis 1962 un code unique et international pour 174 millions d’entreprises dans le monde. Chaque entité est associée avec un code d’activité international unique. Une solution pratique mais qui présente deux inconvénients :

  • elle est coûteuse car vous devez utiliser pour chaque entreprise le code D-U-N-S® Number dont l’identification est payante,
  • elle ne concerne pas 100% des entreprises dans le monde, mais les plus importantes de chaque pays.


Solution 2 : choisir des niveaux d’analyses standards

Il s’agit d’accepter de réaliser des analyses sur les fichiers et données à un niveau de précision moindre. Dans les faits, qu’est ce que cela signifie ? Si les concordances ne peuvent pas être réalisées avec le niveau le plus fin de la nomenclature, elles peuvent être réalisées à un niveau plus général. On peut par exemple trouver des tables de concordance entre les 2 premiers caractères de chaque codification.

Par exemple, on ne fera pas le distinguo d’un pays à l’autre entre une société qui est dans la téléphonie filaire et une entreprise qui est dans la télécommunication sans fil ou par satellite, mais on associera l’activité au domaine plus général des « Télécommunications », dont le code est le 61. Très souvent, une telle approche suffit à des besoins d’analyse de portefeuille commercial ou de part de marché client. Dans ce cas de figure, cela signifie que chaque pays conserve sa nomenclature standard, mais qu’au moment de la consolidation, vous utilisez des tables de correspondance à un niveau de granulométrie moins précis.

Avantage : vous avez facilement une mise à jour de vos activités par les instituts statistiques locaux (l’Insee en France fournit dans sa Notice 80 le code d’activité NAF révision 2 de l’établissement).

Inconvénient : si vous travaillez sur des progiciels internationaux, vous devez conserver les champs d’enregistrement de nomenclature d’activité pour chaque pays et ajouter les premiers caractères de la codification internationale.


 

 Solutions 
 Datalgo > 

Datalgo propose différents traitements destinés à facilité le rapprochement de données sectorielles.

D'autres possibilités de rapprochements sont possibles. Contactez-nous pour plus d'informations.

 

 

 
Tous droits réservés
Le contenu de cette lettre d'information
ne saurait engager la responsabilité de Datalgo.

 

FORFAITS | Dédoublonnage | Vérification | Enrichissement | Conversion | Normalisation | Text mining | Structuration
 Contact | A propos de Datalgo | Chercher | Commander | © Datalgo