• User Attivo

    url + session indicizzate: problema

    Ciao a tutti.
    Mi hanno dato da ottimizzare un sito e-commerce per cui ritrovo nelle serp risultati del genere.
    Ogni volta che si entra nel sito viene generata una sessione, per cui mi ritrovo nelle serp risultati del genere:

    http://www.sito.com/view.php?cid=2&PHPSESSID=ed11edd2faefed551afb6f19ae47449b
    

    Ora, Google pare essersi piantato :(: anche con una sitemap non sembra accettare nuove pagine. Forse perchè vede come testo duplicato quello delle pagine con la session? E come tagliare il problema alla radice?
    Those are the questions...

    bye


  • User

    riesci a fornire una navigazione che non necessiti di session id? in questo modo non si puo' aggiungere prodotti al carrello, ma la navigazione del catalogo dovrebbe essere garantita.

    google non indicizza generalmente le pagine con id di sessione, come puoi leggere qui:

    http://www.google.it/intl/it/webmasters/guidelines.html


  • User Attivo

    @marcuzzer said:

    google non indicizza generalmente le pagine con id di sessione, come puoi leggere qui:

    http://www.google.it/intl/it/webmasters/guidelines.html

    Ciao, putroppo, malgrado quanto affermato nella pagina che citi, google indicizza bene l'ID di sessione: http://www.google.it/search?q=inurl:PHPSESSID%3D

    Nella stessa SERP trovi anche info su come evitarlo.
    Negli ultimi SES e in rete, fonti interne a google hanno caldeggiato apertamente la pratica di togliere l'ID di sessione al bot.
    Si puo' fare in molti modi: php.ini, .htaccess, white-hat-cloaking (contenuti UGUALI a fronte di URL semplificate per il bot, ovvero IF useragent=googlebot THEN niente ID di sessione).

    Ciao, a presto


  • User Attivo

    @pieropan said:

    Nella stessa SERP trovi anche info su come evitarlo.
    Negli ultimi SES e in rete, fonti interne a google hanno caldeggiato apertamente la pratica di togliere l'ID di sessione al bot.
    Si puo' fare in molti modi: php.ini, .htaccess, white-hat-cloaking (contenuti UGUALI a fronte di URL semplificate per il bot, ovvero IF useragent=googlebot THEN niente ID di sessione).

    Ciao, a presto

    Grazie.
    Ho spiegato il problema al webmaster che ha progettato il sito e gli ho girato dei link interessanti sul tema.

    In sostanza i consigli che gli ho dato sono due:
    a. agire sul php.ini o .htaccess abilitando i cookie
    b. elaborare un'istruzione condizionale che riconosca il bot e faccia un redirect 301 all'url senza id session

    Appena ha risolto pubblico qui i link che sono stati più proficui.

    bye


  • User Attivo

    Rispolvero questo vecchio thread per chiedere qualche consiglio in più sulle php session id.
    Mettiamo il caso che io sia costretto a mantenerle e che voglia semplicemente evitare che google le indicizzi e ne legga quindi un contenuto duplicato, come faccio?
    Da quanto leggo sopra è chiara solo la tecnica del white hat cloaking, alternative? questa tecnica può essere considerata sicura al 100% o a rischio ban?
    Grazie a chiunque mi voglia rispondere.:D


  • User Newbie

    @Mareforzanove said:

    [***]

    Personalmente credo che sia meglio evitare cloaking. Dato che ci sono alternative, non sarebbe meglio seguirle?

    Puoi utilizzare anche un database per storare le sessioni, in questo modo pulisci l'URL. Oppure puoi fare un override delle direttive con un .htaccess, se te lo puoi permettere; in alternativa ancora puoi utilizzare le tecniche sopra citate.

    Comunque credo che a Google non interessi il motivo per cui lo fai, ma interessa come e cosa fai di per sè :D. Sarebbe figo potrci mettere un

    <?php echo "Noooooo Google nooooooo, scusamiiii"; ?> 
    

    😄