Mi chiedo perchè a google non vada mai bene il mio robot.txt .
Mi sapete espiegare come dire a google non indicizzare questa pagina /en
ma indicizza questa cartella /en/
Codice:
Disallow: /en
Mi toglie dai risultati tutte le pagine in inglese.
Codice:
Disallow: /en/
Stessa cosa.
Come faccio a spiegarlo a google?
Grazie
Google
Google (pronuncia gùgol) è un motore di ricerca per Internet.
Grazie, (neppure sul forum di google ho saputo avere una risposta).
avendo un sito con wordpress l'unico modo che ho trovato (tramite questo forum) per distinguere le varie lingue senza plugin ultra pesi è stato quello di creare una pagina "en" senza contenuto e poi una sottopagina
miosito.it/en/pagina-1
miosito.it/en/pagina-2
ecc...
Adesso la pagina en di fatto non esiste, entrandoci esce
Stessa cosa per le altre lingue Forbidden
You don't have permission to access /en/ on this server.
Ho controllato e c'è il redirect automatico da miosito.it/en a miosito.it/en/
scrivendo Disallow: /en/$ non rischio che scompaiano ancora tutte le sottopagine di /en/ ?
Grazie ancora e ciao
Forum
Il Forum è uno strumento di comunicazione dove l'utente può inserire i propri post. Quando in un forum si apre una nuova discussione si crea un topic che potrà essere seguito da molti reply.
Google
Google (pronuncia gùgol) è un motore di ricerca per Internet.
WordPress
WordPress è una piattaforma per la gestione dei contenuti e la creazione di un blog
plugin
O plug-in, o add-in o add-on, rappresenta una particolare applicazione aggiuntiva che ha il compito di interagire con un programma-padre (senza il quale non potrebbe funzionare) per integrarne funzioni e personalizzazioni.
No, non scompaiono, almeno nei 3 grandi motori (Google, Bing, Yahoo!) che interpretano il simbolo $ come fine URL.
In ogni caso, quella pagina di errore, se come immagino è servita con un http error status 403, non dovrebbe essere indicizzata anche senza interventi sul robots.txt.
Prego, ciao.
Robots.txt
Questo file va messo nella root del sito e serve per indicare agli spider dei motori di ricerca cosa non prelevare.
Google
Google (pronuncia gùgol) è un motore di ricerca per Internet.
URL
(Uniform Resource Locator) è un indirizzo di una risorsa in Internet
http
Protocollo progettato per migliorare la qualità e ottimizzare le prestazioni di sistemi distribuiti per la collaborazione e la condivisione delle informazioni. Utilizzato anche come protocollo generico nelle connessioni internet che devono attraversare strati software quali proxy e gateway.