|
Ce traitement en text-mining effectue une analyse de tout le texte et
renvoie par ordre décroissant les principaux noms propres avec pour chacun les noms communs les plus fréquemment associés. Cette fonction prend toute sa dimension sur des textes en langue française mais autorise un traitement encore performant en d'autres langues.
Le texte est fourni selon deux formes au choix :
1. Un fichier électronique de type : Microsoft Word (.doc), Texte (.txt), Rich Text (.rtf), Acrobat (.pdf), Internet (.htm), etc.
2. Une série de fichiers au format texte (.txt). Dans ce cas, il est nécessaire de préciser clairement les fichiers concernés. Le plus simple est alors de les placer tous dans un même dossier ou dans un fichier compressé (.zip) (suite).
Valeur ajoutée
Ce traitement en text mining permet d'un rapide coup d'œil de comprendre l'environnement d'un texte et son sens. On identifie rapidement les principaux concepts associés aux personnes, marques, sociétés, lieux cités. Ainsi, on dispose d'une
"cartographie" de l'information permettant de comprendre les tendances d'un important document.
Les sources peuvent être un ou plusieurs articles de journaux, des documents contractuels ou scientifiques, des ouvrages littéraires ou des essais, des documents techniques, des courriers électroniques, des résultats d'enquêtes ouvertes, etc.
Utilisé en intelligence économique et en knowledge management, ce type de fonction permet d'appréhender rapidement une importante quantité d'information non structurée.
Datalgo propose ici une solution simple et à faible coût, car vous n'êtes pas obligé de faire l'acquisition d'un logiciel coûteux. |