Nwlapcug.com


Come convertire i tag HTML con testo in chiaro in c#

La pagina Web che si vede nel browser non mostrarti tutto sulla pagina. Dietro le quinte, il browser carica costantemente di contenuto che contiene codice HTML criptico. Questo codice è costituito da "tag" come "< p >." Tale tag indica al browser di visualizzare un paragrafo nella pagina Web. Utilizzando c#, linguaggio di sviluppo di Microsoft che funziona con Visual Studio, si può convertire HTML di qualsiasi sito in testo e rimuovere i tag.

Istruzioni

1

Avviare Microsoft Visual Studio. Fare clic su "File" e quindi fare clic su "Nuovo progetto".

2

Fare clic su "Visual c#" per evidenziarlo e fare doppio clic su "Applicazione Windows Form." Visual Studio verrà creare un nuovo progetto e visualizzare un form vuoto nella finestra di progettazione.

3

Fare clic su "Visualizza" e quindi fare clic su "Strumenti" per aprire la casella degli strumenti. Scorrere verso il basso per il controllo WebBrowser e fare doppio clic su esso. Tale controllo verrà visualizzato nel modulo. Visual Studio lo nomina "webBrowser1."

4

Premere "F4". Si apre la finestra "Proprietà". Individuare l'icona di "Lightning Bolt" nella parte superiore della finestra. L'icona è a forma di come un fulmine. Fare clic sull'icona. La finestra "Proprietà" verrà visualizzato un elenco di eventi che è possibile allegare al controllo "webBrowser1".

5

Individuare l'elemento "DocumentCompleted" nell'elenco e fare doppio clic su esso. Una finestra di codice viene aperto e viene visualizzato il seguente codice:

private void webBrowser1_DocumentCompleted (object sender, WebBrowserDocumentCompletedEventArgs e)

{

}

Questo codice viene eseguito ogni volta che il controllo "webBrowser1" termina il caricamento di una pagina Web.

6

Modificare tale codice in modo che assomiglia a questo:

private void webBrowser1_DocumentCompleted (object sender, WebBrowserDocumentCompletedEventArgs e)

{

HtmlDocument doc = webBrowser1. Document;

String websiteText = doc. Body.InnerText;

MessageBox.Show(websiteText);

}

Dopo il caricamento di una pagina Web, questo codice afferra il testo dalla pagina. Viene quindi visualizzato il testo in una finestra di messaggio popup.

7

Fare clic nella finestra del codice e quindi fare clic su "Visualizza finestra di progettazione." Il modulo riapparirà nella finestra di progettazione.

8

Fare doppio clic sulla barra del titolo di quella forma. Apparirà un'altra finestra di codice e metodo "Carico" del form di visualizzazione. Il codice in questo metodo viene eseguito quando il form viene caricato. Il codice viene visualizzato come illustrato di seguito:

private void Form1_Load (object sender, EventArgs e)

{

}

9

Sostituire tale codice con il codice riportato di seguito:

private void Form1_Load (object sender, EventArgs e)

{

sito Web di stringa = "http://www.whitehouse.gov";

webBrowser1.Navigate(website);

}

Questo codice genera il controllo "webBrowser1" per passare all'URL del sito Web memorizzato nella variabile denominata "sito". In questo esempio, tale URL è "http://www.whitehouse.gov."

10

Premere "F5" per eseguire il codice. Il modulo carica ed esegue il codice "Form1_Load". Tale codice, il controllo di "webBrowser1" navigare il sito Web "whitehouse.gov". Il codice "DocumentCompleted" verrà eseguito dopo che il browser ha terminato di caricare quel sito. Una finestra di messaggio popup vi mostrerà il testo da questo sito senza i tag HTML.

Consigli & Avvertenze

  • In questo esempio, il controllo di "webBrowser1" passa al sito Whitehouse. Sostituire l'URL con qualcosa che ti piace. Ad esempio, per convertire i tag HTML e visualizza il testo per "http://www.xyz.com", impostare il valore della variabile denominato "sito Web" a quell'URL. Tale variabile è nel metodo Form_Load, come illustrato nella procedura.