Convertir MHTML a PDF – C#

A menudo se requiere la conversión de MHTML a PDF para aprovechar el formato PDF para tareas específicas. El PDF tiene muchos beneficios que otros archivos no tienen. Por ejemplo, muchos programas y aplicaciones admiten documentos PDF; Los archivos PDF están optimizados para imprimir y son ideales para crear copias físicas de sus documentos; puede configurar los ajustes de seguridad para los archivos PDF: desactivar la impresión, la edición, el uso de una firma electrónica, etc.

En este artículo, encontrará información sobre cómo convertir MHTML a PDF usando los métodos ConvertMHTML() de la clase Converter y cómo aplicar PdfSaveOptions y ICreateStreamProvider parámetros.

Convertidor MHTML en línea

Puede comprobar la funcionalidad de la API Aspose.HTML y convertir MHTML en tiempo real. Cargue un archivo MHTML desde el sistema de archivos local, seleccione el formato de salida y ejecute el ejemplo. En el ejemplo, las opciones de guardar están configuradas de forma predeterminada. Recibirá inmediatamente el resultado en un archivo separado.

                
            

Si desea convertir MHTML a formato PDF mediante programación, consulte los siguientes ejemplos de código C#.

MHTML a PDF por dos líneas de código

Los métodos estáticos de la clase Converter se utilizan principalmente como la forma más sencilla de convertir un código MHTML a varios formatos. Por ejemplo, puede convertir MHTML a PDF en su aplicación C# literalmente con dos líneas de código.

1// Open an existing MHTML file for reading
2using var stream = File.OpenRead(DataDir + "sample.mht");
3
4// Invoke the ConvertMHTML() method to convert MHTML to PDF
5Converter.ConvertMHTML(stream, new PdfSaveOptions(), Path.Combine(OutputDir, "convert-by-two-lines.pdf"));

Convertir MHTML a PDF

Usar los métodos Converter.ConvertMHTML() es la forma más común de convertir código MHTML a varios formatos. Con Aspose.HTML, puede convertir MHTML a formato PDF mediante programación con control total sobre una amplia gama de parámetros de conversión.

El siguiente fragmento de código C# muestra cómo convertir MHTML a PDF usando Aspose.HTML for .NET.

  1. Abra un archivo MHTML existente.
  2. Cree una instancia de la clase PdfSaveOptions.
  3. Utilice el método ConvertMHTML() de la clase Converter para guardar MHTML como un archivo PDF. Debe pasar la secuencia del archivo MHTML, PdfSaveOptions y la ruta del archivo de salida al método ConvertMHTML() para la conversión de MHTML a PDF.

En el ejemplo, utilizamos el método OpenRead() de la clase System.IO.FileStream para abrir y leer archivos del sistema de archivos en la ruta especificada.

 1// Open an existing MHTML file for reading
 2using var stream = File.OpenRead(DataDir + "sample.mht");
 3
 4// Prepare a path to save the converted file
 5string savePath = Path.Combine(OutputDir, "sample-output.pdf");
 6
 7// Create an instance of PdfSaveOptions
 8var options = new PdfSaveOptions();
 9
10// Call the ConvertMHTML() method to convert MHTML to PDF
11Converter.ConvertMHTML(stream, options, savePath);

Opciones de guardado – PdfSaveOptions

Aspose.HTML permite convertir MHTML a PDF utilizando opciones de guardado predeterminadas o personalizadas. El uso de PdfSaveOptions le permite personalizar el proceso de renderizado; puede especificar el page size, margins, permisos de archivo, CSS media-type, etc.

PropertyDescription
JpegQualitySpecifies the quality of JPEG compression for images. The default value is 95.
CssGets a CssOptions object which is used for configuration of CSS properties processing.
DocumentInfoThis property contains information about the output PDF document.
BackgroundColorThis property sets the color that will fill the background of every page. By default, this property is Transparent.
PageSetupThis property gets a page setup object and uses it for configuration output page-set.
HorizontalResolutionSets horizontal resolution for output images in pixels per inch. The default value is 300 dpi.
VerticalResolutionSets vertical resolution for output images in pixels per inch. The default value is 300 dpi.
EncryptionThis property gets or sets encryption details. If it is not set, then no encryption will be performed.

Para obtener más información sobre PdfSaveOptions, lea el artículo Convertidores de ajuste fino.

Convierta MHTML a PDF usando PdfSaveOptions

Para convertir MHTML a PDF con la especificación PdfSaveOptions, debe seguir algunos pasos:

  1. Abra un archivo MHTML existente.
  2. Cree un nuevo objeto PdfSaveOptions y especifique las opciones de guardado.
  3. Utilice el método ConvertMHTML() para guardar MHTML como un archivo PDF. Debe pasar la secuencia del archivo MHTML, PdfSaveOptions y la ruta del archivo de salida al método ConvertMHTML() para la conversión de MHTML a PDF.

El siguiente ejemplo muestra cómo utilizar PdfSaveOptions y crear un archivo PDF con opciones de guardado personalizadas:

 1// Open an existing MHTML file for reading
 2using var stream = File.OpenRead(DataDir + "sample.mht");
 3
 4// Prepare a path to save the converted file
 5string savePath = Path.Combine(OutputDir, "sample-options.pdf");
 6
 7// Create an instance of PdfSaveOptions. Set up the page-size and change the background color to AliceBlue
 8var options = new PdfSaveOptions()
 9{
10    PageSetup =
11        {
12            AnyPage = new Page()
13            {
14                Size = new Aspose.Html.Drawing.Size(Length.FromPixels(3000), Length.FromPixels(1000))
15            }
16        },
17    BackgroundColor = System.Drawing.Color.AliceBlue
18};
19
20// Call the ConvertMHTML() method to convert MHTML to PDF
21Converter.ConvertMHTML(stream, options, savePath);

En el ejemplo, utilizamos el método OpenRead() de la clase System.IO.FileStream para abrir y leer archivos fuente del sistema de archivos en la ruta especificada. El constructor PdfSaveOptions() inicializa una instancia de la clase PdfSaveOptions que se pasa al método ConvertMHTML(). El método ConvertMHTML() toma la stream, las options, la ruta del archivo de salida savePath y realiza la operación de conversión. La clase PdfSaveOptions proporciona numerosas propiedades que le brindan control total sobre una amplia gama de parámetros y mejoran el proceso de conversión de MHTML a formato PDF.

En el ejemplo anterior, usamos:

Proveedores de flujo de salida – Output Stream Providers

Si es necesario guardar archivos en el almacenamiento remoto (por ejemplo, nube, base de datos, etc.), puede implementar la interfaz ICreateStreamProvider para tener control manual sobre el proceso de creación de archivos. Esta interfaz está diseñada como un objeto de devolución de llamada para crear una secuencia al comienzo del documento/página (según el formato de salida) y liberar la secuencia creada inicialmente después de renderizar el documento/página.

Aspose.HTML for .NET proporciona varios tipos de formatos de salida para operaciones de renderizado. Algunos de estos formatos producen un único archivo de salida (por ejemplo, PDF, XPS), otros crean varios archivos (formatos de imagen JPG, PNG, etc.).

El siguiente ejemplo muestra cómo implementar y utilizar su propio MemoryStreamProvider en la aplicación:

 1class MemoryStreamProvider : Aspose.Html.IO.ICreateStreamProvider
 2{
 3    // List of MemoryStream objects created during the document rendering
 4    public List<MemoryStream> Streams { get; } = new List<MemoryStream>();
 5
 6    public Stream GetStream(string name, string extension)
 7    {
 8        // This method is called when only one output stream is required, for instance for XPS, PDF or TIFF formats
 9        MemoryStream result = new MemoryStream();
10        Streams.Add(result);
11        return result;
12    }
13
14    public Stream GetStream(string name, string extension, int page)
15    {
16        // This method is called when the creation of multiple output streams are required. For instance, during the rendering HTML to list of image files (JPG, PNG, etc.)
17        MemoryStream result = new MemoryStream();
18        Streams.Add(result);
19        return result;
20    }
21
22    public void ReleaseStream(Stream stream)
23    {
24        // Here you can release the stream filled with data and, for instance, flush it to the hard-drive
25    }
26
27    public void Dispose()
28    {
29        // Releasing resources
30        foreach (var stream in Streams)
31            stream.Dispose();
32    }
33}

El siguiente código C# demuestra cómo utilizar la clase MemoryStreamProvider y la biblioteca Aspose.HTML for .NET para convertir MHTML a PDF y guardar el resultado en un archivo.

 1// Create an instance of MemoryStreamProvider
 2using var streamProvider = new MemoryStreamProvider();
 3
 4// Open an existing MHTML file for reading
 5using var stream = File.OpenRead(DataDir + "sample.mht");
 6
 7// Prepare a path to save the converted file
 8string savePath = Path.Combine(OutputDir, "stream-provider.pdf");
 9
10// Convert MHTML to PDF by using the MemoryStreamProvider class
11Converter.ConvertMHTML(stream, new PdfSaveOptions(), streamProvider);
12
13// Get access to the memory stream that contains the result data
14var memory = streamProvider.Streams.First();
15memory.Seek(0, SeekOrigin.Begin);
16
17// Flush the result data to the output file
18using (FileStream fs = File.Create(savePath))
19{
20    memory.CopyTo(fs);
21}

Puede descargar los ejemplos completos y los archivos de datos desde GitHub.

Aspose.HTML ofrece un Convertidor de MHTML a PDF gratuito en línea que convierte archivos MHTML a PDF con alta calidad, fácil y rápido. ¡Simplemente cargue, convierta sus archivos y obtenga resultados en unos segundos!

Texto “Convertidor de MHTML a PDF”

Subscribe to Aspose Product Updates

Get monthly newsletters & offers directly delivered to your mailbox.