Extrahieren Sie die PDF-Daten in eine Tabellenkalkulation, um sie auszuwerten. Vergleichen Sie die Ergebnisse von sieben Methoden zur Konvertierung von PDF-Dateien in Excel unter Verwendung zunehmend schwierigerer Datenquellen.
Es wäre ideal, wenn die Informationen, die wir zur Entscheidungsfindung nutzen, leicht zugänglich wären. In der modernen Welt sind viele wichtige Dokumente im Portable Document Format (PDF) gespeichert. Was kann ich tun, um PDFs in Excel zu konvertieren? Es gibt viele Möglichkeiten, PDFs in Excel zu konvertieren.
Es gibt Software von Microsoft und Adobe sowie cloudbasierte Dienste wie PDFTables und Amazon, die für bestimmte Aufgaben genutzt werden können. Es gibt auch Software von anderen Unternehmen wie Microsoft und Adobe.
Welche PDF-zu-Excel-Konvertierung ist die "beste"? Die Antwort auf diese Frage ist ähnlich wie bei der Frage nach dem besten Computer. Es kommt ganz auf Sie an.
Es gibt viele wichtige Faktoren, die Sie bei der Wahl eines PDF-Konverters berücksichtigen sollten.
Es gibt zwei Arten von PDF-Dateien. Die eine wird mit einem Programm wie Microsoft Word erstellt. Die zweite stammt entweder von einem Scan eines Dokuments oder einer Bilddatei. Um zu sehen, welche Datei Sie haben, markieren Sie den Text auf der Seite. Wenn Sie den Text mit einer App markieren können, ist Ihre PDF-Datei erstellt worden. Ist dies nicht der Fall, ist möglicherweise ein Scan erforderlich. Gescannte PDFs werden von einigen PDF-Konvertierungsprogrammen nicht unterstützt.
Einseitige Tabellen sind mit den meisten Tools kompatibel. Schwieriger wird es, wenn sich Tabellen über mehrere Seiten erstrecken oder wenn Daten aus einer Tabellenzelle mit einer anderen kombiniert werden.
Unsere Lösung, mit der die meisten von der Anwendung erzeugten PDF-Dateien erzeugt werden, ist für Sie möglicherweise nicht geeignet, wenn Sie häufig konvertieren.
Sie müssen auch entscheiden, wie wichtig Ihnen die Leistung im Verhältnis zur Benutzerfreundlichkeit und zum Preis ist, genau wie bei jeder anderen Programmwahl.
Um Ihnen die Wahl des richtigen Tools für Ihre Bedürfnisse zu erleichtern, haben wir sieben PDF-zu-Excel-Konvertierungsprogramme anhand von vier PDF-Dateien getestet. Jedes Tool wird in einer anderen Situation getestet, und Sie lernen seine Stärken und Schwächen kennen.
Nachfolgend finden Sie die von uns getesteten Tools. Die Liste beginnt mit den Spitzenreitern. (Denken Sie daran, dass "am besten" zum Teil vom jeweiligen Quelldokument abhängt). Diese Werkzeuge sind von "Ausgezeichnet" bis "Gut" eingestuft, was bedeutet, dass jedes Werkzeug zumindest einen Teil der von uns gestellten Aufgaben mit Bravour gelöst hat.
Adobe ist führend im Bereich PDF-Parsing, da es den Standard für das Portable Document Format entwickelt hat. Eine Mitgliedschaft mit vollem Funktionsumfang ist recht teuer, es gibt jedoch eine Option für $2/Monat, die unbegrenzte Konvertierungen von PDF in Excel ermöglicht (ein Jahresabonnement ist erforderlich). Dieses Dienstprogramm kann auch Microsoft Word-Dateien ausgeben.
Der gesamte Text in Seiten, die sowohl Tabellen als auch Text enthalten, wird in eine Excel-Datei konvertiert. Dies kann entweder von Vorteil sein, wenn der Kontext wichtig ist, oder es kann sich als nachteilig erweisen, wenn Daten für Forschungszwecke benötigt werden.
Die Schnittstelle von Textract ist recht einfach, vor allem für einen AWS-Service. Textract kann mit dem mehrstufigen AWS-Setup-Prozess eingerichtet werden. Amazon bietet jedoch eine Drag-and-Drop-Webdemo an, mit der Sie die Ergebnisse im gezippten CSV-Dateiformat herunterladen können. Sie müssen lediglich ein kostenloses Amazon AWS-Konto einrichten.
Tabula ist eine kostenlose, quelloffene Software, die Sie verwenden können. Die Installation und Verwendung von Tabula ist viel einfacher als bei einigen der kostenlosen Python-Alternativen. Außerdem verfügt es sowohl über eine Befehlszeilen- als auch über eine Browserschnittstelle. Dies erleichtert die Verwendung für Stapelkonvertierungen und Point-and-Click-Operationen.
Tabula war in der Lage, PDFs mit geringer bis mittlerer Komplexität zu verarbeiten, obwohl es Probleme mit dem komplexen PDF gab. Dies steht im Gegensatz zu vielen kostenpflichtigen Plattformen. Tabula erfordert eine separate Java-Installation unter Windows und Linux.
Dieser Dienst kann automatisiert werden, was ein wichtiger Vorteil ist. Die API des Dienstes ist sehr gut dokumentiert und kann zur Unterstützung einer Vielzahl von Programmiersprachen wie Java, C++ und PHP verwendet werden.
PDFTables war in der Lage, die meisten PDF-Tabellen mit der App zu erstellen. Es erkannte sogar, dass eine Kopfzeile mit zwei Spalten effizienter ist als eine. Obwohl die meisten Spalten leer waren, gab es einige Probleme mit Zellen, die sich über zwei Zeilen erstreckten. Es hat mich nichts gekostet, obwohl es das PDF gescannt hat, das den Horror enthielt.
Diese Freemium-Plattform bietet kostenpflichtige Alternativen. Sie erwies sich für uns als einzige Option zum Scannen von PDFs.
Der internetbasierte Dienst kann viele Dateitypen konvertieren: Excel, Word, PowerPoint und AutoCAD sind alle möglich. Mit einem kostenlosen Konto können Sie bis zu fünf Dateien (je 30 MB) pro Woche konvertieren. Bezahlte Kunden haben unbegrenzten Zugang zu 2 GB Daten pro Tag.
Cometdocs unterstützt den öffentlich-rechtlichen Journalismus. Sie stellen Mitgliedern von Investigative Editors and Reporters kostenlose Premium-Konten zur Verfügung (Offenlegung: Ich habe eines).
Excel bietet eine PDF-Importoption. Diese Funktion ist jedoch nicht für alle Windows-Nutzer mit einem Microsoft 365/Office 365-Abonnement verfügbar. Obwohl sie für einfache Dateien nützlich war, wurde die Funktionalität weniger effektiv, als die PDFs komplexer wurden. Sie kann für Personen, die die Power Query/Transform-Schnittstelle von Excel nicht kennen, verwirrend sein.
Sie können Excel-Tabellen aus PDF-Dateien importieren, indem Sie in der Symbolleiste der Multifunktionsleiste auf Daten > Daten abrufen > Aus Datei > Aus PDF gehen. Wählen Sie dann die Datei aus, die Sie verwenden möchten. Höchstwahrscheinlich haben Sie nur die Möglichkeit, eine einzelne Tabelle zu importieren. Nachdem Sie darauf geklickt haben, wird eine Vorschau Ihrer Tabelle angezeigt, mit der Möglichkeit, die Daten entweder zu laden oder zu ändern. Wenn Sie auf Laden klicken, wird die Tabelle in Ihrem Excel-Blatt angezeigt.
Es ist schnell und einfach, eine Tabelle auf einer Seite zu erstellen. Wenn Sie mehrere Tabellen in einer mehrseitigen PDF-Datei haben, ist diese Option ideal. Solange sich jede Tabelle auf einer Seite befindet. Bei mehreren Tabellen, die über mehrere Seiten verteilt sind, wird es jedoch komplexer, und Sie müssen die Power Query-Techniken kennen.
Es ist unfair, Power Query mit anderen Optionen zu vergleichen, denn jede Ausgabe von PDF-zu-Excel-Konvertern kann in Excel importiert werden, um Power Query-Manipulationen durchzuführen.