Nwlapcug.com


Come convertire HTML in testo Unix

Conversione di un file HTML in un file di testo Unix non è così difficile come sembra. Un file di testo Unix è solo un \"regular\" file di testo di Windows con diversi marcatori di end-of-line. (Unix utilizza la riga di inserimento carattere o LF; Windows utilizza una combinazione di ritorno a capo e avanzamento riga caratteri o CRLF). Per convertire un file Unix, tutto quello che dovete fare è cambiare le terminazioni di linea a quelle corrette. Una conversione non è solitamente necessaria in quanto la maggior parte dei programmi gestirà in modo trasparente la conversione, ma nel caso in cui è necessario eseguire questa conversione, i passaggi sono semplici.

Istruzioni

Da Windows

1

Convertire il file HTML in un file di testo normale. I browser moderni come Internet Explorer e Firefox possono salvare i file HTML come testo normale. Aprire il file nel browser. Premere \"Save As\" o \"Save Page As\" dal menu file. Selezionare \"Text file\" in \"Save come Type\<MIME" nella finestra di dialogo per convertire il file.

2

Convertire il file di testo in un file di testo Unix. In Windows, utilizzare un editor di testo avanzato. Aprire il file nell'editor. Cercare \"Convert per Unix format\" (o simile) sotto \"Tools\" o \"Options.\"

3

Verificare che il file è stato convertito. All'interno dell'editor di testo avanzato, scegliere \"Show fine del line\" in \"View.\" le terminazioni di linea dovrebbero essere tutti \"LF.\"

Da Unix/Linux

4

Convertire il file HTML in un file di testo normale. Utilizzare un browser o l'utilità della riga di comando standard \"lynx.\" In un terminale, digitare URL \"lynx-dump > FILENAME\" per convertire una pagina web in un file di testo normale.

5

Convertire il file di testo in un file di testo Unix utilizzando il \"tr\ standard" utilità. Se hai utilizzato un programma Unix/Linux nel passaggio 1 per convertire il file HTML, questo passo non dovrebbe essere necessario. In un terminale, digitare in \"tr -d '\r' < TEXT_FILE > file_convertito. \"

6

Verificare che il file è stato convertito. Utilizzare il programma \"cat\" che è anche standard su sistemi Unix/Linux. In un terminale, digitare in \"cat -e FILENAME\" per visualizzare il file. Le terminazioni di linea dovrebbero essere tutti il simbolo del dollaro ($). (Se vedete un \"^M\"personaggio, poi la linea terminazioni sono in formato Windows.)

Consigli & Avvertenze

  • Il programma Lynx è in realtà un browser Web testuale. Utilizzarlo per navigare sul web in formato testo normale.