Convertir PDF a texto

Convertir página PDF a archivo de texto

Puedes convertir un documento PDF a un archivo TXT con Aspose.PDF para Android a través de Java. Debes utilizar el método Visit de la clase TextAbsorber para resolver esta tarea.

El siguiente fragmento de código explica cómo extraer los textos de las páginas particulares.

public void convertPDFPagesToTXT() {
        // Abrir documento
        try {
            document = new Document(inputStream);
        } catch (Exception e) {
            resultMessage.setText(e.getMessage());
            return;
        }

        TextAbsorber ta = new TextAbsorber();
        int[] pages = new int[] { 1, 3, 4 };

        for (int page : pages) {
            ta.visit(document.getPages().get_Item(page));
        }
        File txtFileName = new File(fileStorage, "PDF-to-Text.txt");

        // Guardar el texto extraído en un archivo de texto
        BufferedWriter writer;
        try {
            writer = new BufferedWriter(new FileWriter(txtFileName));
            writer.write(ta.getText());
            writer.close();
        }
        catch (Exception e) {
            resultMessage.setText(e.getMessage());
            return;
        }
        resultMessage.setText(R.string.success_message);
    }