Extrair Tabelas de PDF em Node.js

Extrair tabelas ao converter arquivos PDF para CSV

Converter PDF para CSV

Se houver tabelas no PDF, elas serão salvas em arquivos CSV separados. Caso você queira converter um documento PDF, você pode usar a função AsposePdfTablesToCSV. Por favor, verifique o seguinte trecho de código para converter arquivo PDF no ambiente Node.js.

CommonJS:

  1. Chame require e importe o módulo asposepdfnodejs como variável AsposePdf.

  2. Especifique o nome do arquivo PDF que será convertido.

  3. Chame AsposePdf como Promise e execute a operação para converter o arquivo. Receba o objeto se for bem-sucedido.

  4. Chame a função AsposePdfTablesToCSV.

  5. Converta o arquivo PDF. Assim, se ‘json.errorCode’ for 0, o resultado da operação é salvo em “ResultPDFtoXlsX.xlsx”. Se o parâmetro json.errorCode não for 0 e, consequentemente, um erro aparecer no seu arquivo, a informação do erro estará contida em ‘json.errorText’.


  const AsposePdf = require('asposepdfnodejs');
  const pdf_file = 'Aspose.pdf';
  AsposePdf().then(AsposePdfModule => {
      /*Converte um arquivo PDF para CSV (extrai tabelas) com o modelo "ResultPdfTablesToCSV{0:D2}.csv" ({0}, {0:D2}, {0:D3}, ... formato número de página), TAB como delimitador e salva*/
      const json = AsposePdfModule.AsposePdfTablesToCSV(pdf_file, "ResultPdfTablesToCSV{0:D2}.csv", "\t");
      console.log("AsposePdfTablesToCSV => %O", json.errorCode == 0 ? json.filesNameResult : json.errorText);
  });

ECMAScript/ES6:

  1. Importe o módulo asposepdfnodejs.

  2. Especifique o nome do arquivo PDF que será convertido.

  3. Inicialize o módulo AsposePdf. Receba o objeto se for bem-sucedido.

  4. Chame a função AsposePdfTablesToCSV.

  5. Converta o arquivo PDF. Assim, se ‘json.errorCode’ for 0, o resultado da operação será salvo em “ResultPDFtoXlsX.xlsx”. Se o parâmetro json.errorCode não for 0 e, consequentemente, um erro aparecer no seu arquivo, a informação do erro estará contida em ‘json.errorText’.


  import AsposePdf from 'asposepdfnodejs';
  const AsposePdfModule = await AsposePdf();
  const pdf_file = 'Aspose.pdf';
  /*Converter um arquivo PDF para CSV (extrair tabelas) com o modelo "ResultPdfTablesToCSV{0:D2}.csv" ({0}, {0:D2}, {0:D3}, ... formato número da página), TAB como delimitador e salvar*/
  const json = AsposePdfModule.AsposePdfTablesToCSV(pdf_file, "ResultPdfTablesToCSV{0:D2}.csv", "\t");
  console.log("AsposePdfTablesToCSV => %O", json.errorCode == 0 ? json.filesNameResult : json.errorText);