• User Attivo

    Sitemap a più livelli per un ecommerce

    Ciao,
    devo gestire un e-commerce con circa 1200 prodotti e volevo ottimizzare la sitemap di tutto il sito.
    L'ecommerce è strutturato così:

    MACRO CATEGORIE
    -> CATEGORIE
    -> PRODOTTI

    La mia idea era di strutturare così le sitemap, creando una sitemap generica che elenca le sitemap di tutte le macrocategorie, che al loro interno elencano i nomi di tutte le relative categorie prodotti, in questo modo:

    sitemap.xml
    -> sitemap_macro_categoria_01.xml
    -> /nome_categoria_01/
    -> /nome_categoria_02/
    -> /nome_categoria_03/
    -> sitemap_macro_categoria_02.xml
    -> /nome_categoria_04/
    -> /nome_categoria_05/
    -> /nome_categoria_06/
    -> sitemap_macro_categoria_03.xml
    -> /nome_categoria_07/
    -> /nome_categoria_08/
    -> /nome_categoria_09/

    Posso evitare quindi di includere nelle sitemap i nomi di tutti i prodotti ? I nomi dei prodotti il crawler li dovrebbe prendere all'interno di ogni categoria elencata nell'ultimo livello della sitemap...
    Ho visto che ad esempio fanno così anche siti come zalando e yoox ...

    Cosa ne dite va bene elencare così le macro categorie e categorie evitando di elencare anche tutti i prodotti ?

    Ciao e grazie


  • Moderatore

    Ciao studio77,

    @studio77 said:

    Posso evitare quindi di includere nelle sitemap i nomi di tutti i prodotti ? I nomi dei prodotti il crawler li dovrebbe prendere all'interno di ogni categoria elencata nell'ultimo livello della sitemap...
    Ho visto che ad esempio fanno così anche siti come zalando e yoox ...

    Cosa ne dite va bene elencare così le macro categorie e categorie evitando di elencare anche tutti i prodotti ?
    Ho notato che Zalando fa così (ma con un solo livello); non so che vantaggio le porti.
    Potrebbe essere il tentativo di dare maggiore risalto agli occhi dei motori di ricerca a pagine con keyword generiche ad alta concorrenza come "felpe da donna" (tentativo riuscito, immagino grazie alla forza del loro brand e PageRank), laddove le pagine di prodotto hanno titoli poco appetibili per la ricerca, come "Even&Odd Felpa - light grey melange".

    Quello non sappiamo è quali e quante sitemap invia a Google che non si chiamino /sitemap.xml e non siano citate nel /robots.txt
    Negli e-commerce è abbastanza normale fare ricorso a sitemap, anche temporanee, dedicate a sotto insiemi di pagine di prodotto.
    Potremmo pertanto avere una visione molto parziale del loro approccio.

    Nulla ti impedisce di fare una sitemap come hai descritto. Tieni però monitorato lo stato di indicizzazione e - soprattutto quanto velocemente il motore di ricerca riflette un eventuale aggiornamento delle pagine di prodotto, per esempio dopo un cambio prezzi.
    A proposito: un modo pratico per capire lo stato di indicizzazione delle pagine di prodotto, magari suddivise per categorie, è proprio usare sitemap dedicate...

    Spero d'esserti stato utile


  • User Attivo

    Ciao...
    alla fine ho deciso di procedere così:

    1. Parto da una sitemap iniziale con indice che rimanda a tutte le macro-categorie (che sono 9), esempio "macro-categoria-01. xml"
    2. Ogni macro-categoria (indice) rimanda a sua volta a tutte le rispettive categorie, esempio "categoria-01.xml" che contengono ognuna la lista di tutti i prodotti

    Quindi alla fine organizzo per Google i prodotti attraverso un percorso organizzato e suddiviso per Macro-categorie e categorie, del tipo:

    sitemap.xml
    -> sitemap_macro_categoria_01.xml
    -> sitemap_categoria_01.xml
    -> URL_nome_prodotto_01.php

    Cosa ne dici ? Può essere una buona organizzazione a livelli (o ad albero) che chiarisca meglio a Google come sono organizzati i miei prodotti e magari mi indicizzi meglio gli stessi ?
    Ho letto un po' in giro che organizzare le sitemap ad albero può portare un piccolo vantaggio in termini di indicizzazione da parte di Google che recepisce meglio la struttura del sito.

    DOMANDA: in questo modo però gli passo "solo" tutti gli URL dei prodotti (che sono circa 1200) ... devo fare anche in parallelo due sitemap con la lista delle Macro-categorie e Categorie ? e anche un'altra per le pagine del "boilerplate" ?


  • Moderatore

    @studio77 said:

    alla fine ho deciso di procedere così:

    1. Parto da una sitemap iniziale con indice che rimanda a tutte le macro-categorie (che sono 9), esempio "macro-categoria-01. xml"
    2. Ogni macro-categoria (indice) rimanda a sua volta a tutte le rispettive categorie, esempio "categoria-01.xml" che contengono ognuna la lista di tutti i prodotti

    Quindi alla fine organizzo per Google i prodotti attraverso un percorso organizzato e suddiviso per Macro-categorie e categorie, del tipo:

    sitemap.xml
    -> sitemap_macro_categoria_01.xml
    -> sitemap_categoria_01.xml
    -> URL_nome_prodotto_01.php

    Cosa ne dici ?
    Dico che va bene.

    @studio77 said:

    Può essere una buona organizzazione a livelli (o ad albero) che chiarisca meglio a Google come sono organizzati i miei prodotti e magari mi indicizzi meglio gli stessi ?
    Ho letto un po' in giro che organizzare le sitemap ad albero può portare un piccolo vantaggio in termini di indicizzazione da parte di Google che recepisce meglio la struttura del sito
    Non credo. Le Sitemap XML non dicono nulla sulla struttura del sito, sono una rappresentazione piatta.
    La struttura del sito è inferita da struttura di link (tramite esplorazione degli stessi), ed eventuali breadcrumbs.
    Le Sitemap XML servono solo come un ausilio alla "discovery" di pagine, al segnalarne aggiornamento, e un suggerimento alla loro indicizzazione come forma canonical nel caso di ambiguità. Una pagina è o indicizzata o non indicizzata, non può esserlo meglio o peggio.

    @studio77 said:

    DOMANDA: in questo modo però gli passo "solo" tutti gli URL dei prodotti (che sono circa 1200) ... devo fare anche in parallelo due sitemap con la lista delle Macro-categorie e Categorie ? e anche un'altra per le pagine del "boilerplate" ?
    Cerchiamo di ricordare la funzione delle sitemap:
    Una grandissima percentuale di siti non ne ha bisogno: il motore di ricerca è in grado di trovare tutte le pagine con la semplice esplorazione di link. Con una buona struttura di link è presumibile che le pagine principale "chi siamo", etc.. (immagino tu intenda queste per "borderplate") le trova da solo e indicizza senza problemi.

    Come detto, il loro scopo è sia agevolare la "discovery", specie per siti complessi come gli e-commerce, con centinaia di migliaia di pagine e "faceted navigation". Con la sitemap si può suggerire l'URL canonico da scegliere in caso di duplicazioni non risolte e link canonical non presenti, cercare di suggerire una priorità nel crawling (difficile, specie se si cerca di "barare" suggerendo change frequency e lastmod falsi, il motore di ricerca perde fiducia nell'indicazione), etc...

    Se un e-commerce avesse un certo sottoinsieme di pagine nuove o aggiornate, e volesse comunicarle al più presto al motore di ricerca, invece di sperare questo le (ri)rivisiti da solo può inviare a Google una sitemap.

    Nulla ti impedisce di fare una sitemap anche per le pagine principali del sito, non è particolarmente importante a mio avviso.

    Spero d'esserti stato utile


  • User Attivo

    Ciao ... sì certo, come sempre, sei stato molto utile e chiaro!!!

    Se per le pagine diciamo "istituzionali" (tipo "chi siamo", ecc...) a questo punto posso evitare di indicarle in una sitemap (come giustamente mi suggerisci tu, e sono d'accordo), cosa ne dici invece di una eventuale sitemap dedicata alle macro-categorie e una alle categorie ?
    Servirebbe secondo te ? In caso contrario sto indicando, tramite sitemap, solo le URL delle schede prodotto ... può bastare ?


  • Moderatore

    @studio77 said:

    [...], cosa ne dici invece di una eventuale sitemap dedicata alle macro-categorie e una alle categorie ?
    Servirebbe secondo te ? In caso contrario sto indicando, tramite sitemap, solo le URL delle schede prodotto ... può bastare ?
    Di sicuro io farei sitemap dedicate alle singole schede prodotto, raggruppate per categorie per praticità. Tutto il resto è un "di più".
    Fare quelle per categorie e/o macro-categorie... male non fa. Molto dipende da quanto c'è di indicizzabile in esse. Guardando Zalando, vedo anche per le macro-categoria vi sono una selezione, con anteprima e prezzo. Se per esempio volessero assicurarsi siano aggiornate al più presto nella copia cache di google in seguito a un aggiornamento prezzi, si invia la sitemap di macrocategoria per cercare di accelerare.


  • User Attivo

    ok perfetto, grazie mille del consiglio!


  • User Attivo

    invece per il discorso priorità, ho letto un po' in giro che gestirle bene non sarebbe male (ovviamente).
    Cioè ho letto che ovviamente dare priorità 1 a tutte le pagine del sito, sia essa la home page o la macro-categoria o categoria o scheda prodotto, non va bene mentre dare una logica di priorità a scalare darebbe anche più senso ai contenuti e farebbe capire meglio l'importanza dei contenuti a Google.

    Pensavo a qualcosa di questo tipo, dimmi cosa ne pensi:

    IPOTESI A
    HOME PAGE -> priorità 1
    MACRO CATEGORIE -> priorità 0.9
    CATEGORIE -> priorità 0.8
    SCHEDE PRODOTTO -> priorità 1
    PAGINE ISTITUZIONALI -> priorità 0.7

    oppure (se la logica della ipotesi qui sopra è sbagliata)

    IPOTESI B
    HOME PAGE -> priorità 1
    MACRO CATEGORIE -> priorità 0.9
    CATEGORIE -> priorità 0.8
    SCHEDE PRODOTTO -> priorità 0.7
    PAGINE ISTITUZIONALI -> priorità 0.6
    Però in questo caso do una priorità non altissima alle schede prodotto che sono però il contenuto che più mi interessa, quindi forse non va bene ...

    Cosa ne pensi ?
    Ciao e grazie


  • Moderatore

    @studio77 said:

    [...] mentre dare una logica di priorità a scalare darebbe anche più senso ai contenuti e farebbe capire meglio l'importanza dei contenuti a Google.
    E' bene tenere presente che il tag "priority" oltre a essere un solo suggerimento, non suggerisce "importanza dei contenuti", ma solo la priorità desiderata nel crawling.
    In pratica stiamo chiedendo con la sitemap di visitare dei contenuti, e possibilmente visitarli nell'ordine indicato dalla priorità indicata.


  • User Attivo

    @Federico Sasso said:

    E' bene tenere presente che il tag "priority" oltre a essere un solo suggerimento, non suggerisce "importanza dei contenuti", ma solo la priorità desiderata nel crawling.
    In pratica stiamo chiedendo con la sitemap di visitare dei contenuti, e possibilmente visitarli nell'ordine indicato dalla priorità indicata.

    E' vero, hai perfettamente ragione...
    Però, mi chiedo, se i contenuti del sito li classifico in ordire di priorità non organizzo meglio anche il crawling di tutto il contenuto ?
    Indirettamente non gli sto dicendo quali sono le priorità di crawling del mio sito (ovviamente stiamo sempre parlando di siti con oltre 1000 pagine) ?
    Oppure, forse meglio porla così la domanda, non è corretto evitare, come fanno molti, di mettere per qualsiasi contenuto una priorità alta pari a 1 ?

    Ciao e grazie


  • Moderatore

    @studio77 said:

    Oppure, forse meglio porla così la domanda, non è corretto evitare, come fanno molti, di mettere per qualsiasi contenuto una priorità alta pari a 1 ?
    Concordo!
    Mettere tutto a priorità 1 non ha senso, è come non metterla 🙂

    Tornando alla domanda originale, ti dico cosa faccio io:

    Non sono particolarmente fanatico dell'esprimere una priority nelle sitemap, ma le volte l'ho fatto ho impostato una priorità maggiore a seconda della profondità di pagina. Il ragionamento è che se devo dare precedenza nel crawling a delle pagine, siano quelle più visibili.

    Certo, alla fin fine le pagine mi fanno convertire in un e-commerce sono le schede prodotto, ma l'importanza di una singola scheda è relativa, ed è verosimile esse siano link-ate dalla macro-categoria.

    Mettere tutte le pagine prodotto con priorità 1 secondo me ha poco senso, perché su un piccolo e-commerce di un migliaio di pagine (come hai ipotizzato), probabilmente l'80-90% saranno schede prodotto (escludo i vari casi di faceted navigation, dò per scontato le duplicazioni siano tutte risolte), e sarebbe come ricadere nel caso in cui tutto è 1.

    Per siti molto grossi, per esempio e-commerce di centinaia di migliaia di pagine, trovo la priority sia solo un modo per rendere le sitemap più pesanti.
    Preferisco segmentare in più sitemap che raccolgano le schede di ogni singola categoria, e non esprimere priority (tanto saranno tutte uguali).

    Ho il serio sospetto (non ho dati oggettivi, sebbene abbia in passato di estrarli) che il tag priority sia ben poco preso in considerazione almeno da Google, che il crawling almeno all'inizio sia maggiormente delegato alla normale esplorazione di link, e che la priorità di crawling stimata più che altro in base a PageRank e frequenza di aggiornamento delle pagine (intendo frequenza rilevata oggettivamente dal motore di ricerca in base alle esplorazione passate, non in base al tag changefreq nelle sitemaps).
    Molto di queste mie ultime sentenze però è impressioni personali, opinioni come detto non sostenuta da dati, occasionalmente confortate da qualche affermazione sparsa con nonchalance nel tempo da googlers in alcuni video e/o social media.

    Spero d'esserti stato utile


  • User

    Ciao a tutti, ho visto questo thread e ne approfitto per chiarirmi un dubbio che ho per un sito su cui sto lavorando. Si tratta sempre di un e-commerce, cms Magento, su cui noto una grossa differenza tra pagine inviate dalle sitemap e quelle indicizzate (20%).
    Le sitemap sono su più livelli ma mentre l'indice è nella directory principale, ossia: //esempio.it/sitemap.xml le altre sitemap sono tutte raggruppate in una directory: //esempio.it/sm/sitemap1.xml, //esempio.it/sm/sitemap2.xml etc...

    Questa impostazione va bene o è un problema?


  • Moderatore

    Ciao Stevetk,

    @Stevetk said:

    Le sitemap sono su più livelli ma mentre l'indice è nella directory principale, ossia: //esempio.it/sitemap.xml le altre sitemap sono tutte raggruppate in una directory: //esempio.it/sm/sitemap1.xml, //esempio.it/sm/sitemap2.xml etc...

    Questa impostazione va bene o è un problema?
    Se vogliamo attenerci strettamente al protocollo sitemap, una sitemap in una sottocartella dovrebbe essere usata solamente per elencare URL contenuti in quella sottocartella (o sottostanti). Ora non ricordo se Google (in particolare, che qui la fa da padrone come share di mercato) sia più tollerante a riguardo; nel dubbio le metterei tutte all'indirizzo di root come da specifiche sitemaps.org

    Spero d'esserti stato utile


  • User

    Ciao Federico, grazie mille per la risposta. Il mio dubbio infatti nasce proprio da quanto riportato su sitemaps.org
    Se ho interpretato bene, in una situazione di questo tipo: esempio.it/blog/ sarebbe anche corretto avere la sitemap nella sottocartella specifica quindi /esempio.it/blog/sitemap_blog.xml?

    grazie.


  • Moderatore

    @Stevetk said:

    Se ho interpretato bene, in una situazione di questo tipo: esempio.it/blog/ sarebbe anche corretto avere la sitemap nella sottocartella specifica quindi /esempio.it/blog/sitemap_blog.xml?

    Ciao