將PDF數據提取到電子表格中以進行評估。比較使用日益困難的數據源將PDF文件轉換為Excel的七種方法的結果。
對於我們用來做出決策的信息應該很容易訪問,這將是理想的選擇。在現代世界中,許多重要的文檔以便攜式文檔格式(PDF)存儲。我該怎麼做才能將PDF轉換為Excel?有很多PDF可用於Excel轉換。
可提供來自Microsoft和Adobe的軟件,以及可用於特定任務的基於雲的服務(例如PDFTABLES和AMAZON)。還有其他公司像Microsoft和Adobe這樣的軟件。
什麼是excel轉換的PDF是“最好的?”這個問題的答案與最好的計算機相似。這一切都取決於您。
選擇PDF轉換器時,您應該考慮許多重要因素。
PDF文件有兩種類型。一個是使用Microsoft Word等程序創建的。第二個來自文檔或圖片文件的掃描。要查看您擁有的內容,請在頁面上突出顯示文本。如果您能夠使用應用程序突出顯示文本,則已經創建了PDF。如果不進行掃描,可能需要進行掃描。掃描的PDF不受某些PDF轉換軟件的支持。
一頁表將與大多數工具兼容。當桌子跨越多個頁面或將一個表單元格與另一個表單元組合在一起時,事情變得越來越困難。
如果您是常見的轉換器,我們生產最多的應用PDF的解決方案可能對您不起作用。
您還必須確定與其他計劃選擇一樣,相對於可用性和價格,相對於您的可用性和價格,性能對您的重要性。
為了幫助您選擇滿足您需求的合適工具,我們使用四個PDF文件測試了七個PDF-TO-EXCEL轉換程序。每個工具將在不同的情況下進行測試,您將學習其優點和缺點。
以下是我們評估的工具。該列表從表現最好的人開始。 (請記住,“最佳”部分取決於每個源文檔)。這些工具從“優質到良好”排名,這意味著每個工具至少可以執行至少一部分我們分配的任務。
Adobe是PDF解析的領導者,已經開發了便攜式文檔格式標準。功能齊全的會員資格非常昂貴,但是每月有2美元的選項,允許無限制的PDF脫穎而出轉換(需要年度訂閱)。該實用程序還可以輸出Microsoft Word文件。
所有包含表和文本的頁面中的所有文本都將轉換為Excel文件。如果上下文很重要,則可能是有益的,或者如果需要數據來進行研究目的,則可能證明是不利的。
Textract的界面非常簡單,尤其是對於AWS服務。可以使用多步AWS設置流程進行TEXTRACT。但是,Amazon提供了拖放Web演示,可讓您以zpipted CSV文件格式下載結果。您只需要創建一個Amazon AWS免費帳戶即可。
Tabula是可以使用的免費開源軟件。 Tabula的安裝和使用要比某些免費的Python替代方案容易得多。它還具有命令行接口和瀏覽器接口。這使得易於用於批處理轉換和點擊操作。
儘管存在復雜的PDF問題,但Tabula能夠處理具有低到中等複雜性的PDF。這與許多付費平台形成鮮明對比。 Tabula需要在Windows和Linux上安裝單獨的Java。
該服務可以自動化,這是一個重要的好處。該服務的API已充分記錄,可用於支持包括Java,C ++和PHP在內的各種編程語言。
PDFtables能夠使用該應用程序創建大多數PDF表。它甚至認識到,具有兩列的標頭行比一列更有效。儘管大多數列都是空的,但在兩條線上伸展的細胞存在一些問題。即使掃描了包含恐怖的PDF,它也沒有花我任何花費。
這個免費增值平台提供了付費替代方案。事實證明,這是我們掃描PDF的唯一選擇。
基於網站的服務可以轉換許多文件類型:Excel,Word,PowerPoint和AutoCAD都是可能的。使用免費帳戶,您可以每周轉換最多五個文件(每30MB)。付費客戶每天無限制地訪問2GB數據。
Cometdocs是公共服務新聞業的支持者。他們為調查編輯和記者提供免費賬戶(披露:我確實有一個)。
Excel提供PDF導入選項。但是,使用Microsoft 365/Office 365訂閱的Windows的所有用戶都無法使用此功能。儘管它對簡單文件很有用,但隨著PDF變得更加複雜,功能變得較低。對於不知道Excel的功率查詢 /轉換接口的人來說,這可能會令人困惑。
您可以通過轉到數據>從功能區工具欄中的PDF獲取數據>從PDF文件中導入Excel電子表格。然後選擇要使用的文件。最有可能的是,您只能選擇導入單個表。單擊它後,它將顯示表的預覽,其中包含加載或修改數據的選項。單擊加載後,該表將顯示在您的Excel表上。
從一個頁面創建表很快,很容易。如果您在乘法PDF上有多個表,則此選項效果很好。只要每個桌子都位於一頁上。但是,如果您的多個表分佈在幾頁上,那麼它將變得更加複雜,您將需要知道電源查詢技術。
將電源查詢與其他選項進行比較是不公平的,因為可以將PDF到Excel轉換器的任何輸出導入Excel以執行功率查詢操作。