Datalgo

ConfidentialitéCommanderEntrepriseChercherContact

data cleaning

 Simplifiez la gestion de vos données


AccueilForfaits tout comprisDédoublonnageVérificationEnrichissementConversionNormalisationText miningStructuration

Extraction de mots | Comptages | Analyses

Accueil > Traitements > Text mining > Extraction de mots > Fréquence des principaux noms propres

Traitements
  Rubriques :
  Fréquence des principaux noms propres
  Fréquence des principaux noms communs
  Extraction des sites web d'un texte
  Extraction des adresses emails d'un texte
 

Voir aussi :

  Dédoublonnage des noms de personnes
Déduplication des noms de personnes
Dirigeants des sociétés
Nom prénom en caractères minuscules
Séparation du nom et du prénom
Tri alphabétique des patronymes
Fréquence des associations de mots
Tonalité positive ou négative
Analyse de la richesse de style
Détection de plagiat entre deux textes
Forfait Document textuel
  Tous les traitements
Toutes nos infos
  Solutions :
 

Forfaits tout compris
  Par métiers
 

Datalgo :

  Tarifs et abonnements
  Fonctionnement
  Savoir faire
  Confidentialité
 

Newsletter :

 

Flash conseil gratuit

  S'abonner
  Consulter
 

Recherche rapide :

 

Fréquence des principaux noms propres

Indexe et classe les noms propres les plus fréquents dans un texte.

Commande
À partir de 169euros

Pour cet exemple,
Datalgo a analysé
une série de
textes consacrés au
Général de Gaulle.

Il retourne ici les 14
premiers mots clés
ainsi que le nombre de
citations pour chacun :
 Fréquence des mots 

Ce traitement en text-mining de Datalgo effectue une analyse de tout le texte soumis et renvoie par ordre décroissant les principaux noms propres. Cette fonction prend toute sa dimension sur des textes en langue française, mais elle autorise un traitement encore performant sur d'autres langues.

Le texte est fourni selon deux formes au choix :

1. Un fichier électronique de type : Microsoft Word (.doc), Texte (.txt), Rich Text (.rtf), Acrobat (.pdf), Internet (.htm), etc.

2. Un ensemble de fichiers au format texte (.txt). Dans ce cas, il est nécessaire de préciser clairement les fichiers concernés. Le plus simple est alors de les placer tous dans un même dossier ou dans un fichier compressé (.zip) (suite).

Valeur ajoutée

Cette fonction permet de comprendre très rapidement les principaux acteurs apparaissant dans un texte. Il peut s'agir de personnes, d'entreprises, de marques, de villes, de mots officiels…

Les sources peuvent être un ou plusieurs articles de journaux, des documents contractuels ou scientifiques, des ouvrages littéraires ou des essais, des documents techniques, des courriers électroniques, des résultats d'enquêtes ouvertes, etc.

Utilisé en intelligence économique, ce type de fonction permet de connaître facilement le réseau d'une personne et les relations privilégiées qu'il entretient.

Datalgo propose ici une solution simple et à faible coût, car vous n'êtes pas obligé de faire l'acquisition d'un logiciel coûteux.

 

Commande
 Paramètres   Tarifs en euros   Offre groupée

Paramètre du bon de commandeComplétez les paramètres suivants sur le bon de commande :

 

Format du fichier : ______
Nom du (ou des) fichier(s) : ______
Pour un seul traitement :
Référence Périodicité T1 T2 T3
PC601010 Ponctuel 169 330 490
Pour un traitement annuel régulier :
Référence Périodicité T1 T2 T3
AH601010 Hebdo 7536 14715 21850
AB601010 Bimensuel 3789 7399 10987
AM601010 Mensuel 1961 3830 5687

Choisissez vos tarifs...
en fonction du nombre de lignes dans votre fichier :
  T1  de 1 à 5.000 lignes (ou < 100 pages)
  T2  de 5.001 à 50.000 (ou < 1000 pages)
  T3  de 50.001 à 100.000 (ou < 2000 pages)
 Au dessus, tarif dégressif

Pour calculer le meilleur tarif, Datalgo considère qu'une page sous Word fait 50 lignes (soit environ 4000 caractères).

Économisez 9% en choisissant un autre traitement sur le même fichier :

 

Fréquence des principaux noms propres
+  Fréquence des principaux noms communs
= 2 fonctions et 1 initialisation pour 366 (au lieu de 404€ jusqu'à 5000 lignes)

Bon de commande


En savoir plus

Forfait text mining
Text mining
Forfait tout compris
-20% à partir de

1492€ 1193

Infos

Affichage des résultats : certains noms propres peuvent être scindés en plusieurs parties, surtout lorsqu'il s'agit de personnes dont on cite rarement le prénom. Dans le doute, Datalgo fait apparaître plusieurs fois le noms et les prénoms. Par exemple, dans le cas d'un même texte qui mentionne les "Dupond" sous trois formes : "Philippe Dupond" et son fils "Pierre Dupond" ou encore "M. Dupond", Datalgo a la prudence de vous dire combien de "Dupond", de "Pierre" et de "Philippe" sont comptabilisés dans le document.

Le text-mining consiste à exploiter des données textuelles pour en structurer et en organiser le contenu à des fins d'analyse et de prise de décision.

 

FORFAITS | Dédoublonnage | Vérification | Enrichissement | Conversion | Normalisation | Text mining | Structuration
 Contact | A propos de Datalgo | Chercher | Commander | © Datalgo