Tabula

  • Mise à jour le 25/05/20
Télécharger
  • 1.2.1
  • |
  • Logiciel Libre

Tabula est une solution open source permettant d’extraire des données à partir de documents PDF non éditables. Le logiciel n’est pas un simple scanner OCR. Il permet d’importer des données depuis des PDF non modifiables dans une feuille de calcul CSV ou Microsoft Excel.

Tabula est très populaire chez les journalistes anglo-saxons. En effet, il est utilisé pour traiter des données qui permettent d’alimenter des enquêtes et reportages du New York Times ou du Times Of London, pour ne citer qu’eux.

L’application est relativement simple d’utilisation et est doté d’une fonctionnalité de détection automatique des tableaux. Pour extraire des données avec Tabula, vous devez d’abord télécharger l’archive correspondant à votre OS (Windows, Mac ou Linux). Extrayez l’archive puis lancez le fichier exécutable Tabula. Une fenêtre d’invite de commandes s’ouvrira. Dans la foulée, une page web dédiée s’ouvrira dans votre navigateur. Depuis cette page, vous pourrez importer votre document PDF et procéder à l’extraction de vos données en dessinant un cadre à l’aide de votre souris.

Capture d'écran Tabula
{{ reviewsOverall }} / 5 Abonnés (0 votes)
Note
Ce que vous en pensez... Laisser un commentaire
Trier par:

Soyez le premier à laisser un commentaire.

User AvatarUser Avatar
Verified
/ 5
{{{ review.rating_title }}}
{{{review.rating_comment | nl2br}}}

Show more
{{ pageNumber+1 }}
Laisser un commentaire