Nwlapcug.com


Come estrarre testo da un documento PDF

Può essere molto frustrante tentare di estrarre il testo da un file PDF da utilizzare in un'altra applicazione. Non è raro per la grafica ottenere nel modo, o per il layout del documento per rendere difficile per la prova di essere trasferiti in frasi significative. Anche se non è Impossibile estrarre il testo con un approccio di copia-e-incolla, esso può richiedere molto tempo e non consente per il testo del file PDF da esportare come un formato diverso. Tuttavia, ci sono alcuni modi per estrarre testo da un file PDF.

Istruzioni

Estrarre il testo utilizzando Acrobat Reader

1

Aprire il file in Acrobat Reader. In Windows, selezionare "File -> Esporta documento al testo," il nome del documento e salvarlo.

2

Copiare il testo su un Mac o Linux OS accedendo dal menu Visualizza e scegliendo "Continua" o "Rivolto a continuo." (L'ex vi fornirà il testo in una colonna, mentre quest'ultimo consentirà di formattare il testo come side-by-side pagine.) Vai a "Modifica -> Seleziona tutto" e poi "Modifica -> copia."

3

Se si desidera estrarre parte del testo, utilizzare lo strumento Seleziona. Fare clic sullo strumento "Seleziona testo" e quindi scegli le informazioni che si desidera. In un documento formattato in colonne multiple, è necessario utilizzare lo strumento "Seleziona colonna" in primo luogo. Vai a "Modifica -> copia."

Convertire da PDF a HTML

4

Utilizzare Gmail come un collegamento. Allegare il file PDF a un'e-mail e inviarlo al tuo account Gmail. Quando si apre l'e-mail si vedrà una serie di opzioni accanto all'allegato. Scegliere "Visualizza come HTML" e salvare il file che si apre in una finestra separata. Anche se non sarete in grado di visualizzare qualsiasi grafica, il file HTML manterrà la formattazione del testo del documento.

5

Estrarre e convertire i file sulla riga di comando. Gli utenti Linux possono utilizzare un comando di conversione di base che cambierà un file PDF in un file txt: "file pdftotext." Assicurarsi di sostituire il nome del file con il nome del file PDF.

6

Scaricare un file PDF programma di conversione di testo. Ci sono una serie di programmi open source e freeware disponibile come PDFBox ed Easy PDF to Text Converter (Vedi risorse qui sotto). Molti di questi programmi può anche convertire file PDF in formato HTML pure.

Consigli & Avvertenze

  • Determinare se il documento è formattato per contenere sia testo che grafica. L'approccio di Adobe Acrobat funziona solo se il file PDF contiene entrambi; non funziona per i file con solo immagini. In alcuni casi il testo in un documento PDF è effettivamente formattato come un'immagine. Questo accade spesso quando un documento originale viene analizzato e viene creato un file PDF dall'immagine acquisita.
  • Preparatevi a riformattare parte del testo quando si utilizza Acrobat Reader. Questo modo di estrazione semplicemente Esporta il file PDF in un file di testo..--lo non conservare necessariamente mantenere la formattazione. Tuttavia, se hai solo bisogno di usare le parole questo non dovrebbe essere un problema.