• User

    404 su URL con nofollow

    Salve a tutti!

    Ho un problemino. Mi sono accorto sul Google Webmaster Tools che su un mio sito mi dà parecchi 404 (qualche migliaio!!).

    Molte di queste URL o sono molto vecchie (risorse non esistenti ormai da un anno) oppure URL con nofollow.

    Mi chiedo:

    1. se una risorsa è vecchia e non più esistente (per la quale non è mai stato fornito un 301) dopo quanto tempo lo spider si rassegna e smette di cercarla?? Preciso che non c'è più nessuna pagina che punta a quelle risorse.

    2. Lo spider non dovrebbe limitarsi a seguire le URL fornite nella sitemap (regolarmente inserita) senza andare a cercare vecchie URL peraltro senza referrals?

    3. ma lo spider rispetta o no il rel="nofollow" ??!?

    Grazie a tutti!


  • User Attivo

    Ciao, anche a me è capitato di avere segnalazioni di pagine 404 su google webmaster tools, e ne ho chiesto la rimozione tramite l'apposito modulo.
    Puoi provare a fare anche tu così.

    In un caso mi hanno risposto che finchè c'è anche una sola risorsa che linka alla pagina (anche se questa non esiste più) questa non può essere rimosso.

    Ti ho citato la mia esperienza personale, ma per le risposte più tecniche aspetta i consigli degli esperti 🙂 ciao, Laura
    Postato via Mobile


  • User

    Ciao sdv :),
    proverò ad aiutarti...

    1. se una risorsa è vecchia e non più esistente (per la quale non è mai stato fornito un 301) dopo quanto tempo lo spider si rassegna e smette di cercarla?? ...

    Mai teoricamente, se c'è un link da un sito esterno, a meno che tu non informi google tramite l'apposito modulo. Un limite di tempo ci sarà ma non saprei dirti quanto sia.

    1. Lo spider non dovrebbe limitarsi a seguire le URL fornite nella sitemap (regolarmente inserita) senza andare a cercare vecchie URL peraltro senza referrals?

    No, proprio perché lui segue link presenti esternamente al tuo sito sui quali non hai controllo. La sitemap è quel 'qualcosa in più', ma lo spider fa il suo sporco lavoro indipendentemente da questa, che per inciso, potrebbe anche essere non corretta.

    1. ma lo spider rispetta o no il rel="nofollow" ??!?

    Certo, ma il no-follow serve solo per indicare che il tuo sito non passa la tua popolarità attraverso quel link (che punta all'esterno), non è uno strumento per indicare allo spider di non seguire certi link (non indicizzarli cioè). E poi come dicevo influenza cioò che lo spider fa dal tuo sito verso l'esterno, non il contrario.
    Il tuo 'problema' in sostanza sono i link che ricevi da altri siti.

    Ciao!

    :ciauz:


  • User Attivo

    @sdv18sdv said:

    Salve a tutti!

    Ho un problemino. Mi sono accorto sul Google Webmaster Tools che su un mio sito mi dà parecchi 404 (qualche migliaio!!).

    Molte di queste URL o sono molto vecchie (risorse non esistenti ormai da un anno) oppure URL con nofollow.

    Mi chiedo:

    1. se una risorsa è vecchia e non più esistente (per la quale non è mai stato fornito un 301) dopo quanto tempo lo spider si rassegna e smette di cercarla?? Preciso che non c'è più nessuna pagina che punta a quelle risorse.

    Ma questo controllo come lo hai fatto?


  • User

    Ciao,
    è un post un pò datato (su cui sono arrivato cercando informazioni sul nofollow..), ma vorrei fare una piccola aggiunta sul "nofollow": in realtà "dovrebbe" funzionare anche per i link esterni e non solo per quelli che puntano siti esterni.

    La sua funzione (correggetemi se sbaglio, eh!) non è solo quella di "non passare PR" ma anche di evitare che gli spider di google seguono link interni "non utili" (nel mio caso, ad esempio, migliaia di pagine con mappe... ).

    E' un lavoro che ho fatto con la sitemap.xml, ma farlo con il nofollow è sicuramente più comodo!!!!

    Preso da google:
    *
    Prima che il tag nofollow fosse utilizzato per i singoli link, impedire ai robot di seguire i singoli link su una pagina richiedeva un notevole impegno (ad esempio, reindirizzando il link a un URL bloccato in robots.txt). Per questo motivo è stato creato il valore attributo nofollow dell'attributo rel, che consente ai webmaster di effettuare un controllo più mirato. Anziché indicare ai motori di ricerca e ai bot di non seguire tutti i link presenti nella pagina, ti consente di indicare facilmente ai robot di non eseguire la scansione di un determinato link.*

    Ulteriori info qui:

    www . google. com /support/webmasters/bin/answer.py?hl=it&answer=96569

    Saluti,
    Davide