Nwlapcug.com


Come convertire HTML in testo ASP

Il linguaggio di programmazione ASP consente di recuperare il codice HTML della pagina web e convertirlo in testo normale. Questo è utile se si desidera estrarre informazioni da un sito Web e striscia fuori i tag HTML prima di analizzare le informazioni. È possibile utilizzare la funzione "Replace" spogliarsi di qualsiasi tag HTML dai dati HTML e restituire solo il testo. Bastano solo poche righe di codice per implementare una conversione di HTML in testo.

Istruzioni

1

Creare le variabili di applicazione ASP. Queste variabili tengono il testo HTML e il contenuto di testo convertito. Il codice riportato di seguito viene illustrato come creare le variabili ASP:

Dim html As String

Dim text As String

2

Aggiungere alcuni HTML alla variabile "html". Questo può essere il testo immesso da un utente, creato nel form o una pagina web HTML. Il codice seguente aggiunge un tag title semplice alla variabile HTML:

html = "< title > la mia pagina Web < / title >"

3

Creare la funzione che estrae il codice HTML. La seguente funzione strisce qualsiasi tag HTML e interamente dal codice della pagina web:

Public Function HTMLtoText (ByVal HTML As String) As String

Dim strip As _

System.Text.RegularExpressions.Regex

Return strip.Replace(HTML, "&lt;[^>]*>", "")

End Function

4

Convertire HTML in testo e assegnarlo alla variabile "testo". Si chiama la funzione creata nel passaggio 3 per rimuovere i tag. Il risultato di ritorno è testo. Il codice riportato di seguito viene illustrato come convertire il codice:

testo = HTMLtoText(html)