La libreria di Java "jsoup" contiene una funzione che le strisce una stringa Java di tutti i tag HTML e converte il contenuto in testo normale. Questa libreria è utile quando si desidera scaricare siti Web e sito Web HTML e valutare solo il testo nel vostro programma. Il contenuto è lasciato, così è possibile salvare il contenuto in un database o memorizzare il contenuto in un file sul server locale.
Istruzioni
1
Pulsante destro del mouse il file Java che si desidera modificare e selezionare "Apri con". Fare clic su editor di applet Java nell'elenco dei programmi per aprire il codice.
2
Individuare la stringa HTML che si desidera analizzare e creare la variabile di testo normale. Il codice seguente crea una variabile per memorizzare il contenuto HTML analizzato:
Documento con testo in chiaro = null;
3
Analizzare il codice HTML in testo normale e memorizzare il risultato alla variabile "testo normale". Il codice riportato di seguito viene illustrato come analizzare i tag HTML:
plainText = Jsoup.parse(html);
Sostituire "html" con il proprio stringa HTML.