+ Rispondi alla Discussione
Risultati da 1 a 16 di 16

Meglio usare robots.txt o il meta tag ?

Ultimo Messaggio di WWW il:
  1. #1
    User
    Data Registrazione
    Jan 2006
    Messaggi
    405

    Meglio usare robots.txt o il meta tag ?

    Secondo voi Ŕ meglio specificare quali pagine non indicizzare con robots.txt oppure usare
    <meta name="robots" content="noindex,nofollow" />
    ?

  2. #2
    User L'avatar di lucabartoli
    Data Registrazione
    Feb 2010
    LocalitÓ
    Torino
    Messaggi
    510
    Vanno bene entrambi.
    Google consiglia di impostare il robots.txt, ma di fatto a volte se ne frega di quello che ci scrivi dentro (esperienza personale).

  3. #3
    ModSenior L'avatar di vnotarfrancesco
    Data Registrazione
    Oct 2009
    LocalitÓ
    Torino
    Messaggi
    14,658
    Segui vnotarfrancesco su Twitter Aggiungi vnotarfrancesco su Google+ Aggiungi vnotarfrancesco su Linkedin
    Stessa esperienza mia, meglio usare ambedue le tecniche (anche perchÚ non c'Ŕ solo Google).


    Valerio Notarfrancesco
    MODSeo e Tecnologie
    Per consigli e strategie SEO seguimi su Google Plus +Valerio Notarfrancesco - Twitter
    Seconda edizione Seo Power

  4. #4
    User
    Data Registrazione
    Mar 2009
    Messaggi
    49
    Ciao, mi spiegate come inserire per una determinata pagina il meta tag noindex?

    Nel frattempo ho dovuto eliminare degli articoli e nel file robots.txt ho inserito questa stringhe:

    Disallow: /2010/05/30/articolodaeliminare/

    Sinceramente non so se prima della cartella 2010 dovevo inserire il nome del sito :

    Disallow: miosito/2010/05/30/nomearticolo/

    Mi potete dare qualche suggerimento?
    grazie.

  5. #5
    ModSenior L'avatar di vnotarfrancesco
    Data Registrazione
    Oct 2009
    LocalitÓ
    Torino
    Messaggi
    14,658
    Segui vnotarfrancesco su Twitter Aggiungi vnotarfrancesco su Google+ Aggiungi vnotarfrancesco su Linkedin
    I'istruzione <meta name="robots" content="noindex"> la devi inserire nella sezione head della pagina html, quindi tra i tag <head> e </head>.
    Disallow senza il nome del dominio, quindi la prima forma che ha scritto.

    Valerio Notarfrancesco
    MODSeo e Tecnologie
    Per consigli e strategie SEO seguimi su Google Plus +Valerio Notarfrancesco - Twitter
    Seconda edizione Seo Power

  6. #6
    User
    Data Registrazione
    Mar 2009
    Messaggi
    49
    Grazie per la risposta.
    Ma ho ancora un dubbio. Il mio sito Ŕ fatto con wordpress. Voglio inserire il meta tag per la pagina eliminata. Se inserisco l'istruzione noindex tra gli head del template diro a google di non indicizzare l'intero sito, sbaglio?

    Come faccio ad inserire il noindex solo per quella pagina?

    Grazie.

  7. #7
    ModSenior L'avatar di vnotarfrancesco
    Data Registrazione
    Oct 2009
    LocalitÓ
    Torino
    Messaggi
    14,658
    Segui vnotarfrancesco su Twitter Aggiungi vnotarfrancesco su Google+ Aggiungi vnotarfrancesco su Linkedin
    Citazione Originariamente Scritto da smart320 Visualizza Messaggio
    Il mio sito Ŕ fatto con wordpress. [...] Se inserisco l'istruzione noindex tra gli head del template diro a google di non indicizzare l'intero sito, sbaglio?
    Non sbagli Ŕ proprio cosý, varrÓ per tutte le pagine del blog, ma non so aiutarti in questo, vediamo se qualcun altro sa come fare altrimenti sarebbe meglio che aprissi un thread specifico nella sezione Wordpress.

    Valerio Notarfrancesco
    MODSeo e Tecnologie
    Per consigli e strategie SEO seguimi su Google Plus +Valerio Notarfrancesco - Twitter
    Seconda edizione Seo Power

  8. #8
    User
    Data Registrazione
    Jan 2010
    LocalitÓ
    Padova
    Messaggi
    252
    La domanda evidenzia un problema di base:

    tramite il robots posso bloccare un file, tutta la cartella, tutti i file di un certo tipo.

    Il metatag invece blocco solo la singola pagina e va messo su tutte quella da bloccare.

    Lo standard ufficiale Ŕ il robots.txt letto da tutti i motori di ricerca degni di tale nome;

    il tag metatag inoltre ti costringerebbe a cambiare tutte le pagine ogni volta che devi includerle o escluderle.
    Ultima modifica di Marco Quadrella; 22-07-10 alle 15:45 Motivo: Maiuscole e punteggiatura.

  9. #9
    ModSenior L'avatar di vnotarfrancesco
    Data Registrazione
    Oct 2009
    LocalitÓ
    Torino
    Messaggi
    14,658
    Segui vnotarfrancesco su Twitter Aggiungi vnotarfrancesco su Google+ Aggiungi vnotarfrancesco su Linkedin
    Provo a fare un po' di chiarezza non sugli standard ma sul funzionamento dei motori di ricerca.
    Citazione Originariamente Scritto da dstorm82 Visualizza Messaggio
    lo standard ufficiale Ŕ il robots.txt letto da tutti i motori di ricerca degni di tale nome;
    Al di la degli standard ufficiali, riporto dalla guida ufficiale di Google ma vale anche per Bing e Yahoo:
    Citazione Originariamente Scritto da Google
    Un file robots.txt limita l'accesso al tuo sito da parte dei robot dei motori di ricerca che eseguono la scansione del Web. Questi bot sono automatici e, prima di accedere alle pagine di un sito, effettuano un controllo per verificare la presenza di un file robots.txt che impedisce loro di accedere a determinate pagine.
    Citazione Originariamente Scritto da Google
    Anche se Google non eseguirÓ la scansione o l'indicizzazione dei contenuti delle pagine bloccate dal file robots.txt, potrÓ comunque indicizzare gli URL trovati su altre pagine web. Di conseguenza, l'URL della pagina e, potenzialmente, anche altre informazioni disponibili [...] possono essere visualizzati nei risultati di ricerca di Google.
    Ho evidenziato in grassetto il nocciolo della questione. Quindi:
    Citazione Originariamente Scritto da Google
    Per impedire che i contenuti di una pagina vengano elencati nell'indice web di Google anche se altri siti contengono link a essa, utilizza un metatag noindex. Quando analizza la pagina, Googlebot riconosce il metatag noindex e impedisce la visualizzazione della pagina nell'indice web.
    Mi raccomando su questo forum di iniziare le frasi con la maiuscola e terminarle con un punto.


    Valerio Notarfrancesco
    MODSeo e Tecnologie
    Per consigli e strategie SEO seguimi su Google Plus +Valerio Notarfrancesco - Twitter
    Seconda edizione Seo Power

  10. #10
    User
    Data Registrazione
    Jan 2010
    LocalitÓ
    Padova
    Messaggi
    252
    Se la pagina Ŕ dinamica e in rewrite come fai?
    Se uno vuole bloccare tutta la cartella, magari composta da centinaia di file?

    Direi che il robots Ŕ l'unica strada percorribile e comunque non ho mai visto un sito che nonostante il blocco del robots avesse pagine indicizzate.

  11. #11
    User L'avatar di lucabartoli
    Data Registrazione
    Feb 2010
    LocalitÓ
    Torino
    Messaggi
    510
    Citazione Originariamente Scritto da dstorm82 Visualizza Messaggio
    e comunque non ho mai visto un sito che nonostante il blocco del robots avesse pagine indicizzate.
    Io si, purtroppo, e mi Ŕ costato una penalizzazione che ci Ŕ voluto un bel po' a risolvere...

  12. #12
    User
    Data Registrazione
    Mar 2009
    Messaggi
    49
    Grazie a tutti, ma nessuno sa come posso risolvere il mio problema ? Inserire un noindex per quelle specifiche pagine? E non per tutto il sito?

    Grazie, in ogni caso chieder˛ anche nella sezione wordpress come mi Ŕ stato consigliato.

    Ciao.

  13. #13
    User
    Data Registrazione
    Jan 2006
    Messaggi
    405
    Citazione Originariamente Scritto da smart320 Visualizza Messaggio
    Grazie a tutti, ma nessuno sa come posso risolvere il mio problema ? Inserire un noindex per quelle specifiche pagine? E non per tutto il sito?

    Grazie, in ogni caso chieder˛ anche nella sezione wordpress come mi Ŕ stato consigliato.

    Ciao.
    Ma sono pagine che hai cancellato o che vuoi solo togliere dall'indice di google ? Se le cancelli fisicamente ritorneranno l'errore 404 quindi dopo un p˛ scompariranno dall'indice, se invece non le vuoi indicizzare probabilmente dovrai installare qualche plugin.

    Se no metti l'indirizzo della pagina su robots.txt , altrimenti se stanno in una specifica categoria puoi fare apparire il meta noindex nofollow in tutte quelle pagine.

  14. #14
    User
    Data Registrazione
    Jan 2006
    Messaggi
    405
    Citazione Originariamente Scritto da vnotarfrancesco Visualizza Messaggio
    Provo a fare un po' di chiarezza non sugli standard ma sul funzionamento dei motori di ricerca.

    Al di la degli standard ufficiali, riporto dalla guida ufficiale di Google ma vale anche per Bing e Yahoo:


    Ho evidenziato in grassetto il nocciolo della questione. Quindi:

    Mi raccomando su questo forum di iniziare le frasi con la maiuscola e terminarle con un punto.


    Valerio Notarfrancesco
    Grazie mille! Tester˛ il tutto e vediamo se scompariranno anche dall'indice.

  15. #15
    User L'avatar di Webmaster70
    Data Registrazione
    Jun 2009
    LocalitÓ
    Bologna
    Messaggi
    1,091
    Aggiungi Webmaster70 su Facebook Aggiungi Webmaster70 su Linkedin
    Io evito entrambe le cose il pi¨ possibile, e invece metto (quando non voglio indicizzare una pagina)

    <meta name="robots" content="noindex,follow" />

    che non mi fa perdere link juice.

  16. #16
    WWW
    WWW Ŕ offline
    Moderatore L'avatar di WWW
    Data Registrazione
    Dec 2007
    LocalitÓ
    Roma
    Messaggi
    2,023
    Segui WWW su Twitter Aggiungi WWW su Google+ Aggiungi WWW su Facebook Aggiungi WWW su Linkedin
    In ogni caso, se hai cancellato la pagina (E svuotato il 'cestino' di WP) il 404 porterÓ alla rapida deindicizzazione.

    Se proprio tu volessi inserire un meta particolare solo per una pagina puoi usare i Conditional Tags di wordpress.

    http://codex.wordpress.org/Conditional_Tags
    f.

+ Rispondi alla Discussione

Tag per Questa Discussione

^ Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
  • Il codice BB Ŕ Attivato
  • Le faccine sono Attivato
  • Il codice [IMG] Ŕ Attivato
  • Il codice [VIDEO] Ŕ Attivato
  • Il codice HTML Ŕ Disattivato
  • Trackbacks Attivato
  • Pingback Attivato
  • Refback Attivato

SEO by vBSEO 3.6.0 PL2 ©2011, Crawlability, Inc.