|
Ce traitement en text-mining de Datalgo effectue une analyse de tout le texte soumis et renvoie par ordre décroissant les principaux noms propres. Cette fonction prend toute sa dimension sur des textes en langue française, mais elle autorise un traitement encore performant sur d'autres langues.
Le texte est fourni selon deux formes au choix :
1. Un fichier électronique de type : Microsoft Word (.doc), Texte (.txt), Rich Text (.rtf), Acrobat (.pdf), Internet (.htm), etc.
2. Un ensemble de fichiers au format texte (.txt). Dans ce cas, il est nécessaire de préciser clairement les fichiers concernés. Le plus simple est alors de les placer tous dans un même dossier ou dans un fichier compressé (.zip) (suite).
Valeur ajoutée
Cette fonction permet de comprendre très rapidement les principaux acteurs apparaissant dans un texte. Il peut s'agir de personnes, d'entreprises, de marques, de villes, de mots officiels…
Les sources peuvent être un ou plusieurs articles de journaux, des documents contractuels ou scientifiques, des ouvrages littéraires ou des essais, des documents techniques, des courriers électroniques, des résultats d'enquêtes ouvertes, etc.
Utilisé en intelligence économique, ce type de fonction permet de connaître facilement le
réseau d'une personne et les relations privilégiées qu'il entretient.
Datalgo propose ici une solution simple et à faible coût, car vous n'êtes pas obligé de faire l'acquisition d'un logiciel coûteux. |