Come utilizzare un Atom Feed in Python / Nwlapcug.com

Atom è un feed standard che utilizza la tecnologia XML Web. Un feed Web è un file che contiene le voci che riassumono e link ai contenuti di un sito Web. Web feed vengono solitamente utilizzati per iscriversi a un sito Web con l'aiuto di un lettore di feed. Un feed reader è un'applicazione che controlla i feed sottoscritti e visualizza e aggiorna sintesi sul contenuto sottoscritto. Lettori di feed sono detto di utilizzare un feed quando si elaborano. È possibile scrivere un semplice script Python che consuma feed Atom in pochi minuti.

Istruzioni

1

Aprire l'editor di testo inattivo in Program Files (o applicazioni per Macintosh), nella directory Python. Si apre un file di codice sorgente in bianco.

2

Importare il modulo di struttura ad albero XML. Questo modulo consente di attraversare facilmente un file XML. Il feed Atom è un file XML, quindi questo è quello che si utilizzerà per utilizzare il feed, dopo averlo scaricato. Per importare il modulo, scrivere quanto segue nella parte superiore del file di codice sorgente:

importazione xml.etree.ElementTree come e

3

Importare il modulo urllib.request. Questo modulo consente di aprire siti internet (URL) e scaricarli. Per importare questo modulo, scrivere la seguente riga:

importazione urllib.request

4

Dichiarare una stringa e impostate il valore uguale all'URL del feed è Atom vuole consumare. Ad esempio, se si voleva utilizzare il sito Web abilitato per Atom feed, è possibile scrivere quanto segue:

feedString = 'http://www.atomenabled.org/atom.xml'

5

Aprire l'URL per il feed utilizzando la funzione di urlopen() Atom. Questa funzione crea un file come oggetto che può passare ad albero XML. È possibile memorizzare il file come oggetto in una variabile denominata tmp come questo:

tmp = urllib.request.urlopen(feedString)

6

Analizzare l'oggetto di tipo di file utilizzando la struttura ad albero XML scrivendo la seguente riga di codice:

albero = etree.parse(tmp)

7

Individuare la radice del file XML utilizzando la funzione GetRoot () del modulo di struttura ad albero. I file XML sono organizzati come alberi, e la radice è la parte superiore del file. Ogni elemento del file XML che si dirama dalla radice. Individuando la radice, ti da un buon punto di partenza per muoversi attraverso il file e le informazioni di spigolatura. Per individuare la radice e memorizzarlo in una variabile denominata 'root', scrivere la seguente riga di codice:

root = tree.getroot()

8

Loop attraverso il file XML utilizzando un ciclo for, come questo:

per bambino in radice:

9

Stampare le informazioni contenute in ogni ramo del file XML premendo il tasto tab e scrivere la seguente riga di codice:

print(child.text)10

Impostare il ramo corrente come nodo radice di un sottoalbero utilizzando la funzione di GetChildren As. Lo scopo di questo è eseguire un ciclo tra i più profondi elementi XML del feed. La sintassi per questa operazione è simile al seguente:

nipoti = child.getchildren()

11

Loop attraverso il 'nipoti' insieme utilizzando un ciclo for, come questo:

per il nipotino in nipoti:

12

Rientro della riga successiva e stampare il testo contenuto nell'elemento XML, come questo:

Print(grandchild.Text)

13

Eseguire il programma con il tasto "F5". Se il computer dispone di accesso a Internet, si consumerà il feed Atom attivato e verrà stampato il testo contenuto nella console.