Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.
A classe PdfExtractor permite que você extraia imagens de um arquivo PDF. Primeiro, você precisa criar um objeto da classe PdfExtractor e vincular o arquivo PDF de entrada usando o método BindPdf. Depois disso, chame o método ExtractImage para extrair todas as imagens para a memória. Uma vez que as imagens sejam extraídas, você pode obter essas imagens com a ajuda dos métodos HasNextImage e GetNextImage. Você precisa percorrer todas as imagens extraídas usando um loop while. Para salvar as imagens no disco, você pode chamar a sobrecarga do método GetNextImage que aceita o caminho do arquivo como argumento. O seguinte trecho de código mostra como extrair imagens de todo o PDF para arquivos.
// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ExtractImagesWholePDF()
{
// The path to the documents directory
var dataDir = RunExamples.GetDataDir_AsposePdf_Images();
// Open PDF document
using (var extractor = new Aspose.Pdf.Facades.PdfExtractor())
{
// Bind PDF document
extractor.BindPdf(dataDir + "sample_cats_dogs.pdf");
// Extract all the images
extractor.ExtractImage();
// Get all the extracted images
while (extractor.HasNextImage())
{
extractor.GetNextImage(dataDir + DateTime.Now.Ticks.ToString() + "_out.jpg");
}
}
}
A classe PdfExtractor permite que você extraia imagens de um arquivo PDF para fluxos. Primeiro, você precisa criar um objeto da classe PdfExtractor e vincular o arquivo PDF de entrada usando o método BindPdf. Depois disso, chame o método ExtractImage para extrair todas as imagens para a memória. Uma vez que as imagens sejam extraídas, você pode obter essas imagens com a ajuda dos métodos HasNextImage e GetNextImage. Você precisa percorrer todas as imagens extraídas usando um loop while. Para salvar as imagens em um fluxo, você pode chamar a sobrecarga do método GetNextImage que aceita Stream como argumento. O seguinte trecho de código mostra como extrair imagens de todo o PDF para fluxos.
// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ExtractImagesWholePDFStreams()
{
// The path to the documents directory
var dataDir = RunExamples.GetDataDir_AsposePdf_Images();
// Open PDF document
using (var extractor = new Aspose.Pdf.Facades.PdfExtractor())
{
// Bind PDF document
extractor.BindPdf(dataDir + "sample_cats_dogs.pdf");
// Extract images
extractor.ExtractImage();
// Get all the extracted images
while (extractor.HasNextImage())
{
// Read image into memory stream
MemoryStream memoryStream = new MemoryStream();
extractor.GetNextImage(memoryStream);
// Write to disk, if you like, or use it otherwise
using (FileStream fileStream = new FileStream(dataDir + DateTime.Now.Ticks.ToString() + "_out.jpg", FileMode.Create))
{
memoryStream.WriteTo(fileStream);
}
}
}
}
Você pode extrair imagens de uma página particular de um arquivo PDF. Para fazer isso, você precisa definir as propriedades StartPage e EndPage para a página específica da qual deseja extrair imagens. Primeiro, você precisa criar um objeto da classe PdfExtractor e vincular o arquivo PDF de entrada usando o método BindPdf. Em segundo lugar, você deve definir as propriedades StartPage e EndPage. Depois disso, chame o método ExtractImage para extrair todas as imagens para a memória. Uma vez que as imagens sejam extraídas, você pode obter essas imagens com a ajuda dos métodos HasNextImage e GetNextImage. Você precisa percorrer todas as imagens extraídas usando um loop while. Você pode salvar as imagens no disco ou em um fluxo. Você só precisa chamar a sobrecarga apropriada do método GetNextImage. O seguinte trecho de código mostra como extrair imagens de uma página particular de PDF para fluxos.
// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ExtractImagesParticularPage()
{
// The path to the documents directory
var dataDir = RunExamples.GetDataDir_AsposePdf_Images();
// Open PDF document
using (var extractor = new Aspose.Pdf.Facades.PdfExtractor())
{
// Bind PDF document
extractor.BindPdf(dataDir + "sample_cats_dogs.pdf");
// Set StartPage and EndPage properties to the page number to
// You want to extract images from
extractor.StartPage = 2;
extractor.EndPage = 2;
// Extract images
extractor.ExtractImage();
// Get extracted images
while (extractor.HasNextImage())
{
// Read image into memory stream
MemoryStream memoryStream = new MemoryStream();
extractor.GetNextImage(memoryStream);
// Write to disk, if you like, or use it otherwise
using (FileStream fileStream = new FileStream(dataDir + DateTime.Now.Ticks.ToString() + "_out.jpg", FileMode.Create))
{
memoryStream.WriteTo(fileStream);
}
}
}
}
Você pode extrair imagens de um intervalo de páginas de um arquivo PDF. Para fazer isso, você precisa definir as propriedades StartPage e EndPage para o intervalo de páginas do qual deseja extrair imagens. Primeiro, você precisa criar um objeto da classe PdfExtractor e vincular o arquivo PDF de entrada usando o método BindPdf. Em segundo lugar, você deve definir as propriedades StartPage e EndPage. Depois disso, chame o método ExtractImage para extrair todas as imagens para a memória. Uma vez que as imagens sejam extraídas, você pode obter essas imagens com a ajuda dos métodos HasNextImage e GetNextImage. Você precisa percorrer todas as imagens extraídas usando um loop while. Você pode salvar as imagens no disco ou em um fluxo. Você só precisa chamar a sobrecarga apropriada do método GetNextImage. O seguinte trecho de código mostra como extrair imagens de um intervalo de páginas de PDF para fluxos.
// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ExtractImagesRangePages()
{
// The path to the documents directory
var dataDir = RunExamples.GetDataDir_AsposePdf_Images();
// Open input PDF
using (var extractor = new Aspose.Pdf.Facades.PdfExtractor())
{
// Bind PDF document
extractor.BindPdf(dataDir + "sample_cats_dogs.pdf");
// Set StartPage and EndPage properties to the page number to
// You want to extract images from
extractor.StartPage = 2;
extractor.EndPage = 2;
// Extract images
extractor.ExtractImage();
// Get extracted images
while (extractor.HasNextImage())
{
// Read image into memory stream
MemoryStream memoryStream = new MemoryStream();
extractor.GetNextImage(memoryStream);
// Write to disk, if you like, or use it otherwise
using (FileStream fileStream = new
FileStream(dataDir + DateTime.Now.Ticks.ToString() + "_out.jpg", FileMode.Create))
{
memoryStream.WriteTo(fileStream);
}
}
}
}
A classe PdfExtractor permite que você extraia imagens de um arquivo PDF. Aspose.PDF suporta dois modos de extração; o primeiro é ActuallyUsedImage, que extrai as imagens realmente usadas no documento PDF. O segundo modo é DefinedInResources, que extrai as imagens definidas nos recursos do documento PDF (modo de extração padrão). Primeiro, você precisa criar um objeto da classe PdfExtractor e vincular o arquivo PDF de entrada usando o método BindPdf. Depois disso, especifique o modo de extração de imagem usando a propriedade PdfExtractor.ExtractImageMode. Em seguida, chame o método ExtractImage para extrair todas as imagens para a memória, dependendo do modo que você especificou. Uma vez que as imagens sejam extraídas, você pode obter essas imagens com a ajuda dos métodos HasNextImage e GetNextImage. Você precisa percorrer todas as imagens extraídas usando um loop while. Para salvar as imagens no disco, você pode chamar a sobrecarga do método GetNextImage que aceita o caminho do arquivo como argumento.
O seguinte trecho de código mostra como extrair imagens de um arquivo PDF usando a opção ExtractImageMode.
// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ExtractImagesImageExtractionMode()
{
// The path to the documents directory
var dataDir = RunExamples.GetDataDir_AsposePdf_Images();
// Open PDF document
using (var extractor = new Aspose.Pdf.Facades.PdfExtractor())
{
// Bind PDF document
extractor.BindPdf(dataDir + "sample_cats_dogs.pdf");
// Specify Image Extraction Mode
//extractor.ExtractImageMode = ExtractImageMode.ActuallyUsed;
extractor.ExtractImageMode = Aspose.Pdf.ExtractImageMode.DefinedInResources;
// Extract Images based on Image Extraction Mode
extractor.ExtractImage();
// Get all the extracted images
while (extractor.HasNextImage())
{
extractor.GetNextImage(dataDir + DateTime.Now.Ticks.ToString() + "_out.png", System.Drawing.Imaging.ImageFormat.Png);
}
}
}
Para verificar se o PDF contém Texto ou Imagens, use o próximo trecho de código:
// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void CheckIfPdfContainsTextOrImages()
{
// The path to the documents directory
var dataDir = RunExamples.GetDataDir_AsposePdf_Images();
// Instantiate a memoryStream object to hold the extracted text from Document
MemoryStream ms = new MemoryStream();
// Instantiate PdfExtractor object
using (var extractor = new Aspose.Pdf.Facades.PdfExtractor())
{
// Bind PDF document
extractor.BindPdf(dataDir + "FilledForm.pdf");
// Extract text from the input PDF document
extractor.ExtractText();
// Save the extracted text to a text file
extractor.GetText(ms);
// Check if the MemoryStream length is greater than or equal to 1
bool containsText = ms.Length >= 1;
// Extract images from the input PDF document
extractor.ExtractImage();
// Calling HasNextImage method in while loop. When images will finish, loop will exit
bool containsImage = extractor.HasNextImage();
// Now find out whether this PDF is text only or image only
if (containsText && !containsImage)
{
Console.WriteLine("PDF contains text only");
}
else if (!containsText && containsImage)
{
Console.WriteLine("PDF contains image only");
}
else if (containsText && containsImage)
{
Console.WriteLine("PDF contains both text and image");
}
else if (!containsText && !containsImage)
{
Console.WriteLine("PDF contains neither text or nor image");
}
}
}
Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.