+ Rispondi alla Discussione
Risultati da 1 a 7 di 7

Come ottimizzare l'indicizzazione per sitemap di grandi dimensioni su Search Console?

Ultimo Messaggio di Sermatica il:
  1. #1
    User Newbie
    Data Registrazione
    Nov 2019
    LocalitÓ
    Torino
    Messaggi
    5

    Come ottimizzare l'indicizzazione per sitemap di grandi dimensioni su Search Console?

    Buongiorno a tutti,
    mi chiedevo se esiste un procedura per ottimizzare l'indicizzazione di una "sitemapindex" di un sito di grandi dimensioni (per ora circa 100.000 url complessive) per un progetto che sto seguendo.

    Ho letto le guide su Google in merito alle dimensioni massime (50 MB) e agli url massimi consentiti per ogni sitemap (50.000 url) ma noi, ad esempio, per evitare problemi abbiamo optato per una soluzione di massimo 1000 url a sitemap

    La prima domanda che mi sono posto Ŕ stata come dare prioritÓ di indicizzazione agli URL che per noi sono pi¨ importanti.

    • Inserendo nei pi¨ importanti (che per˛ per noi sono circa 20.000) il tag <priority> ?
    • Inserendole nelle prime sitemap dell'index?
    • Inserendoli all'inizio di ogni sitemap dell'index?
    • inserendo manualmente una sitemap alla volta?
    • Facendo tutte queste cose insieme ?


    Facendo dei test ho notato che su Search Console non si capisce bene il criterio con cui il processo di indicizzazione avvenga.
    Il problema Ŕ che il processo Ŕ gestibile se si tratta di siti di piccole/medie dimensioni ma con cosý tanti url ci potrebbero volere anni per avere un'indicizzazione completa.

    Scusate per le tante domande ma online ho trovato poche informazioni chiare in merito a parte un riferimento all'API Indexing che per˛ credo sia un servizio di Google solo a pagamento.

    Grazie.

  2. #2
    Moderatore L'avatar di Sermatica
    Data Registrazione
    Sep 2016
    LocalitÓ
    Maleo
    Messaggi
    4,815
    Aggiungi Sermatica su Facebook
    Ciao
    >abbiamo optato per una soluzione di massimo 1000 url a sitemap
    Ok ottimo

    >La prima domanda che mi sono posto Ŕ stata come dare prioritÓ di indicizzazione agli URL che per noi sono pi¨ importanti.

    Questo lo fai con i link interni, quello che ti consiglio Ŕ di creare diverse sitemap, una per le pagine, una per le categorie....
    Ti consiglio anche di strutturare bene le url del sito in modo che puoi controllare per esempio il traffico di /blog o /scarpe

    Il resto delle cose che vuoi fare non serve, segui i consigli sopra.
    MODHelp Center: consigli per il tuo progettoMODE-Commerce
    Consulente con P.IVA: SEO / SEM / Google Business / Amazon - Sermatica.it


  3. #3
    User Newbie
    Data Registrazione
    Nov 2019
    LocalitÓ
    Torino
    Messaggi
    5
    Grazie per le informazioni. Vedremo se nelle prossime settimane cambierÓ qualcosa.

  4. #4
    User L'avatar di aledandrea
    Data Registrazione
    Aug 2017
    LocalitÓ
    Bologna
    Messaggi
    47
    Aggiungi aledandrea su Linkedin
    Citazione Originariamente Scritto da AndreaP85 Visualizza Messaggio
    Scusate per le tante domande ma online ho trovato poche informazioni chiare in merito a parte un riferimento all'API Indexing che per˛ credo sia un servizio di Google solo a pagamento.
    Ciao Andrea,

    No, l'API Indexing di Google Ŕ gratuita. Per˛ Ŕ limitata a certi tipi di contenuti.
    In settimana in Clickable, fine settimana sugli Appennini ⛰

  5. #5
    User Newbie
    Data Registrazione
    Nov 2019
    LocalitÓ
    Torino
    Messaggi
    5
    Citazione Originariamente Scritto da aledandrea Visualizza Messaggio
    Ciao Andrea,

    No, l'API Indexing di Google Ŕ gratuita. Per˛ Ŕ limitata a certi tipi di contenuti.

    Grazie per l'info ma leggendo mi era parso di capire che fosse gratuita per una quota giornaliera predefinita. Se, per˛, si vuole aumentare il volume deve fare richiesta a Google e immagino che questo abbia un prezzo, anche se non Ŕ molto chiaro in realtÓ.

  6. #6
    Moderatore L'avatar di Federico Sasso
    Data Registrazione
    Dec 2012
    LocalitÓ
    Genova
    Messaggi
    1,880
    Segui Federico Sasso su Twitter Aggiungi Federico Sasso su Google+ Aggiungi Federico Sasso su Linkedin
    Ciao AndreaP85,
    ho notato solo ora questa discussione; Ŕ giÓ passata qualche settimana, intervengo per dare un paio di chiarimenti che non credo siano ancora stati dati.
    Citazione Originariamente Scritto da AndreaP85 Visualizza Messaggio
    ...
    La prima domanda che mi sono posto Ŕ stata come dare prioritÓ di indicizzazione agli URL che per noi sono pi¨ importanti.

    • Inserendo nei pi¨ importanti (che per˛ per noi sono circa 20.000) il tag <priority> ?
    • Inserendole nelle prime sitemap dell'index?
    • Inserendoli all'inizio di ogni sitemap dell'index?
    • inserendo manualmente una sitemap alla volta?
    • Facendo tutte queste cose insieme ?

    ...
    Prima di tutto: Google ignora del tutto il tag Priority (riferimento: https://support.google.com/webmaster...r/183668?hl=it )
    Inutile metterlo, gonfierebbe solo la sitemap.

    Poi: l'ordine degli URL nella sitemap almeno ufficialmente non Ŕ indicativo.
    Se sia poi usato implicitamente per come Ŕ realizzato il sistema che consuma le Sitemap, Ŕ plausibile, ma non Ŕ documentato.

    Personalmente le pagine pi¨ prioritarie le inserirei in una sitemap dedicata.

    Citazione Originariamente Scritto da AndreaP85 Visualizza Messaggio
    ...
    Il problema Ŕ che il processo Ŕ gestibile se si tratta di siti di piccole/medie dimensioni ma con cosý tanti url ci potrebbero volere anni per avere un'indicizzazione completa.
    ...
    BhÚ Ŕ vero che siti con centinaia di migliaia, o milioni di URL possono richiedere tempi molto lunghi per essere indicizzati, ma Ŕ anche vero che le sitemap sono un mezzo per accelerare l'indicizzazione.

    Facciamo un po' di conti:

    se hai 100.000 URL, e il bot di google ti visita ogni 5 minuti (normale per siti nuovi o di dimensioni limitate, o con pochi aggiornamenti di pagina), sono 288 visite al giorno, quindi in 347 giorni - meno di un anno - sarebbero tutte visitate e, si spera, indicizzate.

    Se per˛ cambi l'impostazione della frequenza di scansione (come fare: https://support.google.com/webmaster...er/48620?hl=it ) massimizzandola a 2 richieste al secondo (NON ti consiglio di spingere cosý tanto), allora il bot riuscirebbe a visitare tutti gli URL in meno di 14 ore.

    Come detto, NON consiglio di spingere tanto l'impostazione: scegli una frequenza di scansione che non possa mettere in crisi il tuo server.
    Non si tratta solo di banda passante consumata, ma anche e soprattutto di occupazione di memoria visto che ogni richiesta del bot Ŕ priva di cookie di sessione e sarebbe vista come una nuova sessione sul web server. Ogni nuova sessione vuole dire per esempio su vecchi server Apache anche 7MB di memoria allocati per circa 20', quindi circa 16 GB di memoria occupati dalle richieste del bot in ogni istante dopo i primi 20'.

    Scegli una frequenza per te accettabile, e ripristina l'opzione originale quando non ti servirÓ pi¨ (dovrebbe ripristinarsi in automatico dopo 90 giorni).
    Tieni anche conto che molte delle pagine saranno giÓ indicizzate da tempo, quindi il problema Ŕ probabilmente ancora pi¨ ridotto.

    Spero d'esserti stato utile.
    MODPosizionamento nei motori di ricercaFederico Sasso, autore di Visual SEO Studio - Il tool SEO Italiano, disponibile anche in Inglese, Francese, Polacco, Russo, Spagnolo e Tedesco.

  7. #7
    Moderatore L'avatar di Sermatica
    Data Registrazione
    Sep 2016
    LocalitÓ
    Maleo
    Messaggi
    4,815
    Aggiungi Sermatica su Facebook
    Ciao
    alle ottime risposte di Federico aggiungo che ho un sito con circa vdgf e Google mi scansiona in media 29.402 url ogni giorno con picchi di 109.225. Il sito ha pi¨ di 110.000 Url, quindi se il sito Ŕ di qualitÓ il problema della scansione non si pone.
    MODHelp Center: consigli per il tuo progettoMODE-Commerce
    Consulente con P.IVA: SEO / SEM / Google Business / Amazon - Sermatica.it


+ Rispondi alla Discussione

^ Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
  • Il codice BB Ŕ Attivato
  • Le faccine sono Attivato
  • Il codice [IMG] Ŕ Attivato
  • Il codice [VIDEO] Ŕ Attivato
  • Il codice HTML Ŕ Disattivato
  • Trackbacks Attivato
  • Pingback Attivato
  • Refback Attivato

SEO by vBSEO 3.6.0 PL2 ©2011, Crawlability, Inc.