Datalgo

ConfidentialitéCommanderEntrepriseChercherContact

data cleaning

 Simplifiez la gestion de vos données


AccueilForfaits tout comprisDédoublonnageVérificationEnrichissementConversionNormalisationText miningStructuration

Transformation | Simplification

Accueil > Traitements > Structuration > Transformation > Texte non structuré en fichier base de données

Traitements
  Rubriques :
  Texte non structuré en fichier base de données
  Arborescence en fichier base de données
  Mises à jour groupées de données
  Remplacement d'une suite de caractères
  Renommer des noms de fichiers
 

Voir aussi :

  Transformer un fichier relationnel en fichier à plat
Standardiser les données d'un champ
  Tous les traitements
Toutes nos infos
  Solutions :
 

Forfaits tout compris
  Par métiers
 

Datalgo :

  Tarifs et abonnements
  Fonctionnement
  Savoir faire
  Confidentialité
 

Newsletter :

 

Flash conseil gratuit

  S'abonner
  Consulter
 

Recherche rapide :

 

Texte non structuré en fichier base de données

Constitution d'une base de données à partir d'un fichier texte non structuré.

Commande
À partir de 499euros

 Exemple de données
   Traitement Datalgo
 Mise en forme des données
Voir un autre exemple

Datalgo propose une solution de mise en forme d'un document pour l'exploiter à la manière d'une base de données. Le document est analysé, segmenté par typologies d'informations puis organisé pour être facilement exploitable dans un Système de Gestion de Base de Données non relationnelles (SGBD) (suite).

Valeur ajoutée

Transformer un document sous forme de base de données permet de faciliter son exploitation : tri, sélection et mise à jour sont facilités, quels que soient les différents types de contenus. Datalgo étudie votre fichier de départ, le structure et vous le retourne pour une exploitation sous un outil de gestion de base de données simple tel qu'un tableur (Excel par exemple) ou un logiciel de partage comme Lotus Notes. Ce traitement permet également la structuration pour des outils de gestion de base de données plus élaborés comme : Access, 4D, Oracle, DB2, FileMakerPro…

 

Commande
 Paramètres   Tarifs en euros   Offre groupée

Paramètre du bon de commandeComplétez les paramètres suivants sur le bon de commande :

 

Format du fichier : ______
Nom du fichier : ______
Pour un seul traitement :
Référence Périodicité T1 T2 T3
PC701010 Ponctuel 499 973 1447
Pour un traitement annuel régulier :
Référence Périodicité T1 T2 T3
AH701010 Hebdo 22251 43388 64524
AB701010 Bimensuel 11189 21817 32445
AM701010 Mensuel 5791 11292 16793

Choisissez vos tarifs...
en fonction du nombre de lignes dans votre fichier :
  T1  de 1 à 5.000 lignes
  T2  de 5.001 à 50.000
  T3  de 50.001 à 100.000
 Au dessus, tarif dégressif

Économisez 5% en choisissant un autre traitement sur le même fichier :

 

Texte non structuré en fichier base de données
+  Transformer un fichier relationnel en fichier à plat
= 2 fonctions et 1 initialisation pour 716 (au lieu de 754€ jusqu'à 5000 lignes)

Bon de commande


En savoir plus

 Exemple de texte non structuré
    Intervention Datalgo
 Structuration sous forme de base de données

Quelles types de sources Datalgo peut-il structurer ?

Datalgo utilise généralement comme fichier de départ un texte non structuré. Ce peut être par exemple une liste d'articles mis les uns derrière les autres dans un document Word (doc), texte (txt) ou Acrobat (pdf). Ce peut aussi être une extraction d'une autre base de données (un carnet d'adresses issu d'un Palm Pilot ou d'une base Notes) ou encore une série d'étiquettes d'adressage.

Comment Datalgo structure-t-il les données ?

Une procédure permet d'effectuer le transfert vers une base de données :

- analyse dans le document des différentes catégories de données,
- étude de faisabilité,
- marquage des données identifiées par champs,
- création des champs dans la base de données,
- formatage par typologie des différents champs : texte, numérique, date, oui/non, etc.
- exportation des données brutes vers la nouvelle base de données
- tests de cohérence
- exportation du fichier sous le format souhaité.

Attention ! Tous les fichiers ne peuvent pas être traités par Datalgo. Une certaine formalisation des textes est nécessaire. Celle-ci est parfois liée à une forme de présentation, ou à la présence de mots ou de formats courants.

Les données structurées en base de données sont exportées sous forme des formats de fichiers suivant :

- dBASE III, III+, IV et 5
- Paradox, Paradox pour Windows 3.x, 4.x, et 5.0
- Microsoft Excel 3.0, 4.0, 5.0, 7.0/95, 8.0/97, et 9.0/2000
- Rich Text Format (.rtf)
- Lotus 1-2-3 .wk1 et .wk3 formats
- Microsoft Access database 2.0, 7.0/95, 8.0/97, 9.0/2000
- Texte délimité par des caractères (point virgule, tabulation…)
- Texte à largeur fixe (Fixed-width text)

Pour en savoir plus, consulter l'aide consacrée aux différents formats de fichiers.

Quelle différence entre un système de base de données et un système de gestion de base de données relationnelles (ou SGBDR) ?

La base de données permet une exploitation très simple des données dites "verticales". C'est à dire que toutes les données sont contenues dans le même fichier. L'emploi de la base est très simple puisque tout est au même endroit. Les requêtes avec des tris ou des sélections sont faciles à réaliser, même avec un simple tableur comme Excel ou un outil collaboratif comme Lotus Notes.

A l'inverse, le SGBDR nécessite une bonne connaissance des bases de données. Son emploi est plus complexe, car il organise l'information par thèmes, chaque type de données étant dans un fichier particulier. Ceci permet un usage très personnalisé et très complet des données lorsqu'on les met en relation. La structuration en SGBDR exige un temps important de préparation (selon une méthodologie inspirée par Meurise).

 

FORFAITS | Dédoublonnage | Vérification | Enrichissement | Conversion | Normalisation | Text mining | Structuration
 Contact | A propos de Datalgo | Chercher | Commander | © Datalgo