+ Rispondi alla Discussione
Risultati da 1 a 9 di 9

Direttiva disallow

Ultimo Messaggio di Everfluxx il:
  1. #1
    Utente Premium L'avatar di dead
    Data Registrazione
    Nov 2005
    Messaggi
    136

    Direttiva disallow

    ho un piccolo problema:
    una direttiva del tipo
    disallow: /modules/news/index.php?articleid=21
    nel robot.txt, mi blocca l'accesso solo a quello specifico URL o a tutte le pagine che cominciano per
    /modules/news/index.php

    Visit me@ DEAD

  2. #2
    User L'avatar di saayd
    Data Registrazione
    Feb 2006
    Messaggi
    456

    Re: Direttiva disallow

    Citazione Originariamente Scritto da dead
    ho un piccolo problema:
    una direttiva del tipo
    disallow: /modules/news/index.php?articleid=21
    nel robot.txt, mi blocca l'accesso solo a quello specifico URL o a tutte le pagine che cominciano per
    /modules/news/index.php

    Comportamento normalissimo:

    ?articleid=xxx

    non viene visto dai bot come una root da disattivare, quindi baipassa e ti disattiva tutti gli url con index?.

    Prova a risolverlo con un nofollow nell'url


  3. #3
    User L'avatar di sole
    Data Registrazione
    Jun 2005
    Messaggi
    197

    Re: Direttiva disallow

    Citazione Originariamente Scritto da saayd
    Prova a risolverlo con un nofollow nell'url
    Se non desideri che lo spider segua il link possibile che il nofollow non sia sufficiente, in un altro posto veniva consigliato nofollow+link in javascript.

  4. #4
    User L'avatar di saayd
    Data Registrazione
    Feb 2006
    Messaggi
    456

    Re: Direttiva disallow

    Citazione Originariamente Scritto da sole

    Se non desideri che lo spider segua il link possibile che il nofollow non sia sufficiente, in un altro posto veniva consigliato nofollow+link in javascript.
    Si, in effetti in JavaScript Google non lo mastica

  5. #5
    User Attivo L'avatar di must
    Data Registrazione
    Mar 2005
    Localit
    Swieqi, Malta
    Messaggi
    4,327
    Segui must su Twitter Aggiungi must su Google+ Aggiungi must su Facebook Aggiungi must su Linkedin

    Re: Direttiva disallow

    Citazione Originariamente Scritto da saayd

    Si, in effetti in JavaScript Google non lo mastica
    sicuro sicuro? sempre sempre?

  6. #6
    User L'avatar di saayd
    Data Registrazione
    Feb 2006
    Messaggi
    456

    Re: Direttiva disallow

    Citazione Originariamente Scritto da must

    sicuro sicuro? sempre sempre?
    Con i menu js, personalmente ho avuto problemi di indicizzazione. Sempre sempre no, ma spesso.

  7. #7
    Esperto L'avatar di Stuart
    Data Registrazione
    Jan 2006
    Localit
    Torino
    Messaggi
    3,877
    Toglietevi ogni dubbio su come quanto e perch Google segua gli indirizzi all'interno di codice javascript con il thread definitivo
    http://www.giorgiotave.it/forum/viewtopic.php?t=10989

    Occhio agli interventi di beke




    Cordialmente,
    Stuart
    210720082115

  8. #8
    User Attivo L'avatar di ArkaneFactors
    Data Registrazione
    Feb 2006
    Localit
    Antipodi
    Messaggi
    1,481

    Re: Direttiva disallow

    Citazione Originariamente Scritto da dead
    disallow: /modules/news/index.php?articleid=21
    nel robot.txt, mi blocca l'accesso solo a quello specifico URL o a tutte le pagine che cominciano per
    /modules/news/index.php
    A mio parere, quel disallow dovrebbe valere per gli URL che cominciano per /modules/news/index.php?articleid=21.

    Per intenderci:
    • /modules/news/index.php?articleid=21 Bloccato
    • /modules/news/index.php?articleid=211 Bloccato
    • /modules/news/index.php?articleid=21&pippo=1 Bloccato
    • /modules/news/index.php Consentito
    • /modules/news/index.php?articleid=2 Consentito

    Come si comporta Googlebot nell'interpretare quella linea lo puoi verificare facilmente col tool integrato in Sitemaps (tab "Diagnostica" > analisi di robots.txt).

    Ti segnalo anche che Googlebot supporta il pattern matching in robots.txt, permettendo ad esempio di utilizzare l'asterisco "*" per indicare il match di una seguenza di caratteri, e "$" per indicare un match alla fine dell'URL:
    http://www.google.com/support/webmas...y?answer=40367

  9. #9
    Esperto L'avatar di Everfluxx
    Data Registrazione
    Jun 2006
    Localit
    Subpadania
    Messaggi
    1,257
    Ho fatto un test col tool diagnostico di Google Sitemaps che ha confermato la mia interpretazione.

    Ecco il sorgente del robots.txt e i risultati del controllo con Googlebot:

    Codice:
    User-agent: *
    Disallow: /test/test.php?id=123
    • /test/test.php?id=123 Bloccato
    • /test/test.php?id=1234 Bloccato
    • /test/test.php?id=123&pippo=1 Bloccato
    • /test/ Consentito
    • /test/test.php Consentito
    • /test/test.php?id=12 Consentito

+ Rispondi alla Discussione

Tag per Questa Discussione

^ Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
  • Il codice BB Attivato
  • Le faccine sono Attivato
  • Il codice [IMG] Attivato
  • Il codice [VIDEO] Attivato
  • Il codice HTML Disattivato
  • Trackbacks Attivato
  • Pingback Attivato
  • Refback Attivato

SEO by vBSEO 3.6.0 PL2 ©2011, Crawlability, Inc.