- Home
- Categorie
- La Community Connect.gt
- Tutto sulla Community
- file robots.txt
-
file robots.txt
Ciao a tutti,
Spero di essere nella sezione giusta...
ho un dubbio col file robots.txt.
io ho un sito mio www_miosito_com e una cartella www_miosito_com/tennis dedicata a un sito a parte.
ho registrato un dominio www_altrosito_com che ha come root la cartella sopra indicata...
vorrei che questo secondo sito fosse indicizzato autonomamente, non come cartella del primo sito.
se metto
User-agent: *
Disallow: /tennis/
nel file robots.txt del miosito.com non impedisco mica ai robots di visitare www_altrosito_com, giusto?
grazie!
-
Esatto.
-
Non sono proprio l'utente adatto a dare spiegazioni visto che ne so pochissimo ma credo che settando il file robots.txt come hai scritto tu, lo spider non legga il contenuto della cartella /tennis/ e quindi non verrà indicizzato.
Comunque ripeto, le mie conoscenze in questo campo sono minime, lascio la parola ai piu esperti..........
-
Il robots contenente Disallow: /tennis/ bloccherà l'indicizzazione di quella cartella sotto il nome dominio dove risiede il robots.txt.
Se tale cartella è la root di un altro dominio, l'url di tale dominio vengono indicizzati, a meno che non siano bloccati dal robots.txt che risiede nel nuovo dominio. Il robots.txt blocca gli URL.