Extrair Tabelas de PDF em Node.js
Extrair tabelas ao converter arquivos PDF para CSV
Converter PDF para CSV
Se houver tabelas no PDF, elas serão salvas em arquivos CSV separados. Caso você queira converter um documento PDF, você pode usar a função AsposePdfTablesToCSV. Por favor, verifique o seguinte trecho de código para converter arquivo PDF no ambiente Node.js.
CommonJS:
-
Chame
require
e importe o móduloasposepdfnodejs
como variávelAsposePdf
. -
Especifique o nome do arquivo PDF que será convertido.
-
Chame
AsposePdf
como Promise e execute a operação para converter o arquivo. Receba o objeto se for bem-sucedido. -
Chame a função AsposePdfTablesToCSV.
-
Converta o arquivo PDF. Assim, se ‘json.errorCode’ for 0, o resultado da operação é salvo em “ResultPDFtoXlsX.xlsx”. Se o parâmetro json.errorCode não for 0 e, consequentemente, um erro aparecer no seu arquivo, a informação do erro estará contida em ‘json.errorText’.
const AsposePdf = require('asposepdfnodejs');
const pdf_file = 'Aspose.pdf';
AsposePdf().then(AsposePdfModule => {
/*Converte um arquivo PDF para CSV (extrai tabelas) com o modelo "ResultPdfTablesToCSV{0:D2}.csv" ({0}, {0:D2}, {0:D3}, ... formato número de página), TAB como delimitador e salva*/
const json = AsposePdfModule.AsposePdfTablesToCSV(pdf_file, "ResultPdfTablesToCSV{0:D2}.csv", "\t");
console.log("AsposePdfTablesToCSV => %O", json.errorCode == 0 ? json.filesNameResult : json.errorText);
});
ECMAScript/ES6:
-
Importe o módulo
asposepdfnodejs
. -
Especifique o nome do arquivo PDF que será convertido.
-
Inicialize o módulo AsposePdf. Receba o objeto se for bem-sucedido.
-
Chame a função AsposePdfTablesToCSV.
-
Converta o arquivo PDF. Assim, se ‘json.errorCode’ for 0, o resultado da operação será salvo em “ResultPDFtoXlsX.xlsx”. Se o parâmetro json.errorCode não for 0 e, consequentemente, um erro aparecer no seu arquivo, a informação do erro estará contida em ‘json.errorText’.
import AsposePdf from 'asposepdfnodejs';
const AsposePdfModule = await AsposePdf();
const pdf_file = 'Aspose.pdf';
/*Converter um arquivo PDF para CSV (extrair tabelas) com o modelo "ResultPdfTablesToCSV{0:D2}.csv" ({0}, {0:D2}, {0:D3}, ... formato número da página), TAB como delimitador e salvar*/
const json = AsposePdfModule.AsposePdfTablesToCSV(pdf_file, "ResultPdfTablesToCSV{0:D2}.csv", "\t");
console.log("AsposePdfTablesToCSV => %O", json.errorCode == 0 ? json.filesNameResult : json.errorText);