Извлечение объектов диаграмм из PDF-документа (фасады)
Извлечение объектов диаграмм из PDF-документа (фасады)
PDF позволяет группировать содержимое страницы в элементы, называемые Помеченное содержимое. Adobe Acrobat показывает их как “контейнеры”. Объекты диаграмм размещаются в таких объектах. Мы представили новый метод extractMarkedContentAsImages() в классе PdfExtractor для извлечения этих объектов. Этот метод рендерит каждое Помеченное содержимое в отдельное изображение. Пожалуйста, обратите внимание, что все диаграммы не полностью размещены в одном контейнере. Из-за этого некоторые диаграммы будут сохранены в виде отдельных изображений по частям.
Обратите внимание, что правильное группирование содержимого в контейнеры — это ответственность дизайнера PDF-документа. If you want to get charts with header or other objects you should either edit/create the PDF document where whole chart is placed in one container.
Если вы хотите получить диаграммы с заголовком или другими объектами, вам следует либо отредактировать/создать PDF-документ, где вся диаграмма размещена в одном контейнере.
//Open document
//Открыть документ
Document document = new Document("sample.pdf");
//instantiate PdfExtractor
//Создать экземпляр PdfExtractor
PdfExtractor pdfExtractor = new PdfExtractor();
//Extract Chart objects as image in a folder
//Извлечь объекты диаграммы как изображения в папку
pdfExtractor.extractMarkedContentAsImages(document.getPages().get_Item(1), "C:/Temp/Charts_page_1");
document.close();