استخراج الجداول من PDF في Node.js

استخراج الجداول أثناء تحويل PDF إلى ملفات CSV

تحويل PDF إلى CSV

إذا كانت هناك جداول في PDF، فإنها تُحفظ في ملفات CSV منفصلة. في حالة رغبتك في تحويل مستند PDF، يمكنك استخدام دالة AsposePdfTablesToCSV. يرجى التحقق من مقتطف الشيفرة التالي من أجل تحويل ملف PDF في بيئة Node.js.

CommonJS:

  1. استدعاء require واستيراد وحدة asposepdfnodejs كمتغير AsposePdf.

  2. تحديد اسم ملف PDF الذي سيتم تحويله.

  3. استدعاء AsposePdf كـ Promise وتنفيذ العملية لتحويل الملف. استلام الكائن إذا كانت العملية ناجحة.

  4. استدعاء الدالة AsposePdfTablesToCSV.

  5. تحويل ملف PDF. وبالتالي، إذا كان ‘json.errorCode’ يساوي 0، يتم حفظ نتيجة العملية في “ResultPDFtoXlsX.xlsx”. إذا لم يكن معامل json.errorCode يساوي 0، وظهر خطأ في ملفك، ستحتوي معلومات الخطأ على ‘json.errorText’.


  const AsposePdf = require('asposepdfnodejs');
  const pdf_file = 'Aspose.pdf';
  AsposePdf().then(AsposePdfModule => {
      /*تحويل ملف PDF إلى CSV (استخراج الجداول) باستخدام القالب "ResultPdfTablesToCSV{0:D2}.csv" ({0}, {0:D2}, {0:D3}, ... تنسيق رقم الصفحة)، TAB كفاصل وحفظ*/
      const json = AsposePdfModule.AsposePdfTablesToCSV(pdf_file, "ResultPdfTablesToCSV{0:D2}.csv", "\t");
      console.log("AsposePdfTablesToCSV => %O", json.errorCode == 0 ? json.filesNameResult : json.errorText);
  });

ECMAScript/ES6:

  1. استيراد الوحدة asposepdfnodejs.

  2. حدد اسم ملف PDF الذي سيتم تحويله.

  3. قم بتهيئة وحدة AsposePdf. استلم الكائن إذا تم بنجاح.

  4. استدع الدالة AsposePdfTablesToCSV.

  5. قم بتحويل ملف PDF. وبالتالي، إذا كان ‘json.errorCode’ يساوي 0، يتم حفظ نتيجة العملية في “ResultPDFtoXlsX.xlsx”. إذا لم يكن معامل json.errorCode يساوي 0، وظهرت بالتالي خطأ في ملفك، فسيتم تضمين معلومات الخطأ في ‘json.errorText’.


  import AsposePdf from 'asposepdfnodejs';
  const AsposePdfModule = await AsposePdf();
  const pdf_file = 'Aspose.pdf';
  /* تحويل ملف PDF إلى CSV (استخراج الجداول) باستخدام القالب "ResultPdfTablesToCSV{0:D2}.csv" ({0}, {0:D2}, {0:D3}, ... صيغة رقم الصفحة)، TAB كفاصل وحفظ */
  const json = AsposePdfModule.AsposePdfTablesToCSV(pdf_file, "ResultPdfTablesToCSV{0:D2}.csv", "\t");
  console.log("AsposePdfTablesToCSV => %O", json.errorCode == 0 ? json.filesNameResult : json.errorText);