• User Newbie

    Motore di ricerca interno al sito: meglio NOINDEX?

    Ciao!
    Ho un blog wordpress e una pagina di ricerca di questo tipo:

    /cerca/<keywords>

    Mi chiedo: posso far indicizzare a Google tutte queste pagine, o sarebbe meglio chiuderle con un meta robots NOINDEX ?
    Posso incorrere in qualche penalizzazione se non chiudo queste pagine ?
    Io credo di sì, ma vorrei delle "prove" a riguardo oppure una smentita!

    Grazie!


  • ModSenior

    Non c'è una risposta universale ma dipende da sito a sito.
    Le pagine di ricerca prodotte dal tuo cms sono utili per il tuo pubblico oppure producono contenuti duplicati?
    Dalle statistiche vedi se le pagine di ricerca sono delle landing, ovvero delle pagine tramite le quali arrivano i tuoi lettori.

    In base a queste risposte decidi se bloccare o meno la loro indicizzazione.

    Valerio Notarfrancesco


  • User Attivo

    vero, anche io in passato ho avuto lo stesso dubbio, ed sono arrivato alla mia personale conclusione che "in generale" è preferibile impostare il no-index perche' se il sito è fatto bene, tutte le pagine sono (se il sito è fatto bene) raggiungibili tramite la normale navigazione del sito, sia dagli spider che dagli utenti quindi sono indicizzabili senza problemi, quindi:

    • in un discorso di indicizzazione naturale, a partire dalla homepage del tuo sito, i contenuti piu' importanti saranno raggiunti con meno click (perche' magari li metterai in evidenza in homepage), per quelli secondari o ancor meno importanti ce ne vorranno di piu'. Ovviamente senza contare anche il peso delle pagine che avrai impostato sulla sitemap.
    • si evitano loop dello spider all'interno del sito, quindi meno tempo di permanenza, maggiore linearità nella navigazione dello spider,... e sicuramente nell'algoritmo di indicizzazione questo ha un valore positivo.
    • per un visitatore umano, il no-index è indifferente

    ciao,
    Gianluca Panebianco
    [...]


  • Admin

    Se parliamo in senso stretto di Google e vogliamo seguire le sue linee guida allora la risposta è semplice:

    **Use robots.txt to prevent crawling of search results pages or other auto-generated pages that don't add much value for users coming from search engines.
    **
    Poi come dice Valerio se sono realmente utili allora puoi interpretare le parole "that don't add much value for users' a tuo piacimento.

    In alternativa esiste ora anche questo markup che in linea teorica dovrebbe informare il motore sul tipo di contenuto http://schema.org/SearchResultsPage

    Ovviamente poi di casi al limite ce ne sono molti tra cui ad esempio l'ottimo ranking che ottengono i risultati delle ricerche di Twitter.