Extraire les données PDF dans une feuille de calcul pour les évaluer. Comparez les résultats de sept méthodes pour convertir les fichiers PDF en Excel en utilisant des sources de données de plus en plus difficiles.
Il serait idéal pour les informations que nous utilisons pour prendre des décisions devraient être facilement accessibles. Dans le monde moderne, de nombreux documents importants sont stockés au format de documents portables (PDF). Que puis-je faire pour convertir les PDF en Excel? Il existe de nombreux PDF pour exceller les conversions disponibles.
Des logiciels de Microsoft et d'Adobe sont disponibles, ainsi que des services basés sur le cloud tels que les pdftables et Amazon qui peuvent être utilisés pour des tâches spécifiques. Il y a aussi des logiciels fabriqués par d'autres sociétés comme Microsoft et Adobe.
Quel PDF à exceller la conversion est "le meilleur?" La réponse à cette question est similaire à celle du meilleur ordinateur. Tout dépend de toi.
Il existe de nombreux facteurs importants que vous devez considérer lors du choix d'un convertisseur PDF.
Il existe deux types de fichiers PDF. L'un est créé à l'aide d'un programme tel que Microsoft Word. Le second provient d'une analyse d'un document ou d'un fichier photo. Pour voir celui que vous avez, mettez en surbrillance le texte sur la page. Si vous êtes en mesure de mettre en surbrillance le texte à l'aide d'une application, votre PDF a été créé. Une analyse peut être requise si ce n'est pas le cas. Les PDF numérisés ne sont pas pris en charge par certains logiciels de conversion du PDF.
Les tables d'une page seront compatibles avec la plupart des outils. Les choses deviennent plus difficiles lorsque les tableaux couvrent plusieurs pages ou lorsque les données d'une cellule de table sont combinées avec une autre.
Notre solution pour produire les PDF les plus générés par l'application peut ne pas fonctionner pour vous si vous êtes un convertisseur fréquent.
Vous devez également décider de l'importance des performances par rapport à la convivialité et au prix, comme tout autre choix de programme.
Pour vous aider à choisir le bon outil pour vos besoins, nous avons testé sept programmes de conversion PDF-TO EXCEL à l'aide de quatre fichiers PDF. Chaque outil sera testé dans une situation différente et vous apprendrez ses forces et ses faiblesses.
Vous trouverez ci-dessous les outils que nous avons évalués. La liste commence par les meilleurs interprètes. (N'oubliez pas que "le meilleur" dépend en partie de chaque document source). Ces outils sont classés de "Excellent à bon", ce qui signifie que chaque outil a admirablement effectué une partie des tâches que nous avons attribuées.
Adobe est un leader de l'analyse PDF, ayant développé la norme de format de document portable. Un abonnement complet est assez cher, mais il existe une option de 2 $ / mois qui permet à un PDF illimité d'exceller les conversions (un abonnement annuel requis). Cet utilitaire peut également produire des fichiers Microsoft Word.
Tous les textes dans des pages contenant à la fois des tables et du texte sont convertis en fichier Excel. Il peut être bénéfique si le contexte est important ou peut s'avérer désavantageux si des données sont nécessaires à des fins de recherche.
L'interface de Textract est assez simple, surtout pour un service AWS. Textract peut être configuré à l'aide du processus de configuration AWS en plusieurs étapes. Cependant, Amazon propose une démo Web glisser-déposer qui vous permet de télécharger les résultats au format de fichier CSV zippé. Il vous suffit de créer un compte gratuit AMATON AWS.
Tabula est un logiciel gratuit open source que vous pouvez utiliser. L'installation et l'utilisation de Tabula sont beaucoup plus faciles que certaines des alternatives Python gratuites. Il dispose également d'une interface de ligne de commande et d'une interface de navigateur. Cela le rend facile à utiliser pour les conversions par lots et les opérations de points et de clics.
Tabula a pu gérer les PDF avec une complexité faible à modérée, malgré des problèmes avec le PDF complexe. Cela contraste avec de nombreuses plateformes payantes. Tabula nécessite une installation Java séparée sur Windows et Linux.
Ce service peut être automatisé, ce qui est un avantage important. L'API du service est très bien documentée et peut être utilisée pour prendre en charge une variété de langages de programmation, notamment Java, C ++ et PHP.
PDFTables a pu créer la plupart des tables PDF à l'aide de l'application. Il a même reconnu qu'une ligne d'en-tête avec deux colonnes serait plus efficace qu'un. Bien que la majorité des colonnes aient été vides, elle avait des problèmes avec les cellules qui s'étendaient sur deux lignes. Cela ne m'a rien coûté, même s'il a scanné le PDF qui contenait l'horreur.
Cette plate-forme freemium propose des alternatives payantes. Cela s'est avéré être notre seule option pour scanner les PDF.
Le service basé sur le site Web peut convertir de nombreux types de fichiers: Excel, Word, PowerPoint et AutoCAD sont tous possibles. Avec un compte gratuit, vous pouvez convertir jusqu'à cinq fichiers (chacun 30 Mo) par semaine. Les clients payants ont un accès illimité à 2 Go de données chaque jour.
Cometdocs est un partisan du journalisme de service public. Ils fournissent des membres des éditeurs d'investigation et des journalistes avec des comptes premium gratuitement (divulgation: j'en ai un).
Excel propose une option d'importation PDF. Cependant, cette fonctionnalité n'est pas disponible pour tous les utilisateurs de Windows avec un abonnement Microsoft 365 / Office 365. Bien qu'il ait été utile pour les fichiers simples, la fonctionnalité est devenue moins efficace car les PDF sont devenus plus complexes. Cela peut être déroutant pour les personnes qui ne connaissent pas l'interface de requête / transformation d'Excel.
Vous pouvez importer des feuilles de calcul Excel à partir des fichiers PDF en accédant aux données> obtenir des données> à partir du fichier> à partir de PDF dans la barre d'outils du ruban. Choisissez ensuite le fichier que vous souhaitez utiliser. Très probablement, vous n'aurez qu'un seul choix pour importer une seule table. Après avoir cliqué dessus, il affichera un aperçu de votre table avec l'option de charger ou de modifier les données. Après avoir cliqué sur le chargement, le tableau sera affiché sur votre feuille Excel.
Il est rapide et facile de créer une table à partir d'une page. Si vous avez plusieurs tables sur un PDF multipage, cette option fonctionne très bien. Tant que chaque table est située sur une seule page. Cependant, si vous avez plusieurs tables réparties sur plusieurs pages, cela devient plus complexe et vous devrez connaître les techniques de requête de puissance.
Il est injuste de comparer la requête d'alimentation à d'autres options car toute sortie de PDF aux convertisseurs Excel peut être importée dans Excel pour effectuer des manipulations de requête d'alimentation.