Nwlapcug.com


Come bloccare Google di indicizzare un sito Web

Se si crea un sito Web che non è inteso per il grande pubblico, c'è poco motivo per farlo comparire sui motori di ricerca come Google. Se non si desidera che il tuo sito venga indicizzato da Google, non consentire Web di Google crawling robot con un file robots. txt. Robots. txt è uno standard universale per la disattivazione di robot dei motori di ricerca di eseguire la scansione di determinate aree dei siti Web, e robot di Google è configurato per obbedire le indicazioni che fornisci.

Istruzioni

1

Aprire Blocco note o editor di testo alternativo preferito.

2

Tipo "User-agent: Googlebot" sulla prima riga di un nuovo file di testo. Se si desidera bloccare tutti i robot dei motori di ricerca di indicizzare il tuo sito Web, tipo "User-agent: *" invece. Premere "Invio" per passare alla riga successiva.

3

Tipo "Disallow: /" sulla seconda riga del file di testo.

4

Salvare il file di testo con il nome "robots. txt."

5

Connettersi al server Web utilizzando un programma di File Transfer Protocol (FTP) e caricare il file "robots. txt" nella directory principale del tuo sito Web. La directory radice è generalmente denominata "public_html."

6

Aprire un browser Web e digitare "www.example.com/robots.txt", dove "esempio.com" è il nome di dominio del tuo sito Web. Si dovrebbe vedere il file di testo creati vengono visualizzati nella finestra del browser, confermando che Google non strisciare o indicizzare il tuo sito Web.

Consigli & Avvertenze

  • Il robot di indicizzazione Web per Google obbedisce le indicazioni nel file robots. txt, come fanno i robot per altri motori di ricerca. Tuttavia, alcuni robot ignorano robots. txt. Di conseguenza, potrebbe ancora essere possibile per alcuni robot di indicizzazione del tuo sito Web, anche se il tuo file robots. txt contiene la riga "User-agent: *."