• User

    Un dubbio su come gestire un archivio notizie

    Ho un vecchio sito Internet con una sezione news contenente di 10.000 articoli e che da sempre avevo mostrato con la paginazione numerica 1,2,3,4 etc...
    Questo tipo di struttura ha sempre consentito ai motori di raggiungere tutte le pagine ma non è particolarmente funzionale per gli utenti e vorrei pertanto sostituirla con un archivio organizzato per data, ossia raggruppando le notizie del mese e per anno.
    Il mio dubbio è che non vorrei che, facendo questa operazione, possa cambiare qualcosa per la corretta indicizzazione e posizionamento delle pagine.
    Se ci fossero rischi preferirei allora aggiungere un archivio storico a quello già esistente e mostrare anche una sitemap per gli utenti.
    Voi che ne pensate?


  • ModSenior

    Sicuramente una ricerca per anno / mese e per categoria è più comoda per il pubblico, quindi io l'aggiungerei.
    Per quanto riguarda gli aspetti seo vanno sempre valutati nel contesto.
    Se il tuo blog ha solo 20 articoli ad esempio, creare 20 o più pagine pagine di archivio tra paginazione della home page, archivio per data, archivio per categoria e così via non va bene.
    In questo caso puoi ancora creare questi archivi ma sarebbe meglio impedire la loro indicizzazione.

    Come linea di principio valuta la proporzione tra numero di pagine effettivamente contenenti un articolo o del contenuto unico e il numero di pagine di servizio.
    Ovviamente le prime devono essere preponderanti.

    Valerio Notarfrancesco


  • User

    Grazie per il chiarimento Valerio. Dato che le notizie sono più di 10.000 dovrei stare tranquillo. Inoltre in ciascuna pagina dell'archivio ci sono 50 articoli (naturalmente solo i titoli e un paio di righe di descrizione). Mi resta però un dubbio: ho notato che i siti realizzati con wordpress utilizzano nell'archivio il tag "<meta name="robots" content="noindex,follow" />" e se lo fa wordpress non vorrei che dipenda dal fatto che i motori di ricerca vogliono che si escluda l'indicizzazione degli archivi. Se così fosse potrei aggiungere questo tag alla paginazione.

    Roberto


  • User

    Mi sono anche accorto adesso che siti di notevole rilievo come l'Ansa hanno escluso con il file robots.txt le pagine delle categorie come "cinema" "sport" "finanza". A questo punto mi chiedo: se si escludono categorie e archivi le notizie vecchie come vengono indicizzate? E come ricevono link interni dal sito?


  • ModSenior

    No roby, Wordpress di base non imposta proprio nulla, quello che vedi sono solo impostazioni di plugin vari che dovrebbero essere scelte con cognizione.
    Spesso non potendo valutare il progetto editoriale oppure per ripetere ciò che si è letto velocemente su un blog si disabilita l'indicizzazione di intere sezioni che altrimenti potrebbero risultare utili.
    Anche se una pagina poi è bloccata dal robots.txt, Google potrebbe comunque indicizzarla se trova un link su un'altra pagina.
    L'istruzione istruzione per impedire l'indicizzazione è usare il metatag robots noindex.

    Ansa è un portale enorme con un altissimo trust, non guardare quello che fanno loro perché esternamente non possiamo valutare le scelte che sono state fatte.
    Comunque nel loro robots.txt c'è Disallow: /cinema/ ma non è la loro pagina di categoria che invece è ansa.it/web/notizie/rubriche/cinema/cinema.shtml ed è regolarmente presente nell'indice di Google.

    Valerio Notarfrancesco


  • User

    Grazie Valerio. Vedo che hai una notevole competenza in materia SEO. Seguirò i tuoi consigli.


  • ModSenior

    Prego Roby. 🙂

    Valerio Notarfrancesco