• User Newbie

    Sitemap index multilingua e GWT

    Buongiorno,

    ho questa domanda da porvi. Sto gestendo un sito multilingua e multi-country, che al suo interno ha una parte istituzionale (miosito.com con varie lingue miosito.com/it,/en,/es, ecc.) e una parte completamente dedicata allo shop online che cambia in base a lingua e country (miosito.com/it/IT/estore/, miosito.com/en/GB/estore/, ecc.).
    Nell'ultimo esempio il primo it sta per la lingua (italano) e il secondo IT sta per il country code (Italia).

    E' stata creata una sitemap.index suddivisa per sitemap sito istituzionale (diverse sitemap.xml per lingua) e per sitemap parte estore (diverse per country e relativa lingua).

    All'interno poi di ogni singola sitemap è stato inserito il tag alternate hreflang in modo da aiutare Google a capire quale versione della pagina mostrare all'utente in base al paese di provenienza.

    Il mio problema è relativo al fatto che nella sezione di GWT "Targeting Internazionale" Google mi segnala che su 12000 tag hreflang vi sono 755 tag hreflang con errori di tipo "URL specificati nella Sitemap e URL alternativi in "XXX" che non hanno tag di ritorno."

    Cosa significa questo errore? Io ho controllato e i link da Google segnalati hanno il loro tag di ritorno!

    Infine, il posizionamento del sito in SERP si è abbastanza compromesso da qualche giorno a questa parte. Su Google.it non ranka più la home in italiano ma quella in inglese e i sitelinks sono mezzi in inglese e mezzi in italiano! Può essere un problema legato alla sitemap?

    Qualcuno mi sa dare qualche consiglio?

    Alberto


  • Moderatore

    Ciao Alberto,

    difficile esprimersi senza sapere quale sia il sito, ma partiamo da questo punto:
    @panto_ads said:

    ... e una parte completamente dedicata allo shop online che cambia in base a lingua e country (miosito.com/it/IT/estore/, miosito.com/en/GB/estore/, ecc.).
    Nell'ultimo esempio il primo it sta per la lingua (italano) e il secondo IT sta per il country code (Italia).

    [...]

    Infine, il posizionamento del sito in SERP si è abbastanza compromesso da qualche giorno a questa parte. Su Google.it non ranka più la home in italiano ma quella in inglese e i sitelinks sono mezzi in inglese e mezzi in italiano!
    Sicuro che al bot del motore di ricerca non sia possibile accedere a URL con forma del tipo /en/IT o it/GB ?

    Se URL del genere nella parte store è voluto esistano, che misure hai preso per evitare la duplicazione dei contenuti (es. hai preso misure per indicare la forma canonica? o hai impostato alcune versioni a noindex?)

    @panto_ads said:

    All'interno poi di ogni singola sitemap è stato inserito il tag alternate hreflang in modo da aiutare Google a capire quale versione della pagina mostrare all'utente in base al paese di provenienza.
    Non in base al paese di provenienza, hreflang da solo indicazioni sulla lingua, ed è usato per presentare all'utente i contenuti più indicati in base alla lingua impostata nel browser come lingua predefinita.

    @panto_ads said:

    Su Google.it non ranka più la home in italiano ma quella in inglese
    Vi sono diverse possibili cause. Il primo sospetto in genere è un problema di "crawlabilità", per esempio se il sito è multilingua, per caso cerca di fare dei redirect in base alla lingua dell'utente? Va tenuto conto che la maggior parte dei bot dei motori di ricerca non esibisce alcuna lingua predefinita. Come si comporta il sito in tale caso? Se redirezionasse "nel dubbio" verso la versione in Inglese, potrebbe essere una spiegazione.

    Ripeto, senza sapere il sito possiamo solo tirare a indovinare, spero tuttavia d'averti fornito qualche suggerimento utile.


  • User Newbie

    Ciao Federico,

    grazie per la risposta. Ti chiarisco alcuni dubbi da te sollevati:

    Sicuro che al bot del motore di ricerca non sia possibile accedere a URL con forma del tipo /en/IT o it/GB ?

    Se URL del genere nella parte store è voluto esistano, che misure hai preso per evitare la duplicazione dei contenuti (es. hai preso misure per indicare la forma canonica? o hai impostato alcune versioni a noindex?)

    Il bot riesce ad accedere alle URL da te indicate poiché ad esempio un utente inglese che si trova in Italia vuole acquistare in lingua inglese ma dallo store italiano. Su queste pagine è impostato un canonical ma al momento la versione canonica è impostata sulla lingua e non sul country (ad esempio /en/IT ha come versione canonica non /it/IT ma en/IT/). Questo penso sia un problema che devo risolvere, impostando come canonica per tutte le pagine del country IT che variano in base alla lingua la URL /it/IT.

    Non in base al paese di provenienza, hreflang da solo indicazioni sulla lingua, ed è usato per presentare all'utente i contenuti più indicati in base alla lingua impostata nel browser come lingua predefinita.

    Si intendevo quello in realtà, mi sono espresso male. Il redirect in base al paese di provenienza, per il quale ridirezione l'utente su una combinazione di lingua e country precisa, lo fa tramite IP credo.

    Vi sono diverse possibili cause. Il primo sospetto in genere è un problema di "crawlabilità", per esempio se il sito è multilingua, per caso cerca di fare dei redirect in base alla lingua dell'utente? Va tenuto conto che la maggior parte dei bot dei motori di ricerca non esibisce alcuna lingua predefinita. Come si comporta il sito in tale caso? Se redirezionasse "nel dubbio" verso la versione in Inglese, potrebbe essere una spiegazione.

    C'è un redirect 302 in homepage che è stato messo dagli sviluppatori per optare ad un problema che, cercando su Google.it il sito e cliccando sul primo risultato che era la home in italiano, rimandava sul sito in lingua si italiana ma country sempre impostato di default in GB! Sono convinto che sia questo il problema principale per cui è cambiata l'indicizzazione del sito in SERP e che comporta il fatto che ora sia la homepage in inglese a rankare come primo risultato.

    Tu hai qualche consiglio da darmi per risolvere questo problema?


  • Moderatore

    Ciao,

    @panto_ads said:

    Il bot riesce ad accedere alle URL da te indicate poiché ad esempio un utente inglese che si trova in Italia vuole acquistare in lingua inglese ma dallo store italiano. Su queste pagine è impostato un canonical ma al momento la versione canonica è impostata sulla lingua e non sul country (ad esempio /en/IT ha come versione canonica non /it/IT ma en/IT/). Questo penso sia un problema che devo risolvere, impostando come canonica per tutte le pagine del country IT che variano in base alla lingua la URL /it/IT.
    Confesso non mi è molto chiaro come preferisci impostare i canonical. Mi verrebbe naturale impostarli verso coppie del tipo it/IT o en/GB perché siano le uniche coppie indicizzate, ed evitare l'indicizzazione di coppie del tipo it/GB o en/IT.
    Per aiutare l'utente in Italia di lingua Inglese, una volta giunge sul sito, al max gli proporrei - avendo letto la lingua dall'header http accept-language - di visualizzare in una lingua diversa (o vedere il listino relativo a GB, ricordiamoci che la geolocalizzazione via IP non è affidabile al 100%, e a volte non ci si azzecca neppure sulla Nazione).

    @panto_ads said:

    ... lo fa tramite IP credo.

    C'è un redirect 302 in homepage che è stato messo dagli sviluppatori per optare ad un problema che, cercando su Google.it il sito e cliccando sul primo risultato che era la home in italiano, rimandava sul sito in lingua si italiana ma country sempre impostato di default in GB! Sono convinto che sia questo il problema principale per cui è cambiata l'indicizzazione del sito in SERP e che comporta il fatto che ora sia la homepage in inglese a rankare come primo risultato.
    Hai provato a vedere effettivamente cosa è servito al motore di ricerca usando da Google Webmaster Tools "Visualizza come Google"?
    Googlebot visita da IP statunitensi, e non esibisce alcuna lingua. Non è che gli viene presentata da indicizzare la versione it/GB, e questa è presentata come canonica?
    (nota che comunque il canonical è un "forte consiglio", il motore di ricerca potrebbe decidere di ignorarlo qualora ritenesse fosse mal configurato)

    Spero d'esserti stato utile


  • User Newbie

    Grazie dell'aiuto.

    Confesso non mi è molto chiaro come preferisci impostare i canonical. Mi verrebbe naturale impostarli verso coppie del tipo it/IT o en/GB perché siano le uniche coppie indicizzate, ed evitare l'indicizzazione di coppie del tipo it/GB o en/IT.
    Per aiutare l'utente in Italia di lingua Inglese, una volta giunge sul sito, al max gli proporrei - avendo letto la lingua dall'header http accept-language - di visualizzare in una lingua diversa (o vedere il listino relativo a GB, ricordiamoci che la geolocalizzazione via IP non è affidabile al 100%, e a volte non ci si azzecca neppure sulla Nazione).

    I realtà è proprio quello che intendevo io, cioè di impostare i canonical sulle coppie it/IT, en/GB, ecc., per evitare l'indicizzazione delle coppie it/GB, ecc.

    Hai provato a vedere effettivamente cosa è servito al motore di ricerca usando da Google Webmaster Tools "Visualizza come Google"?
    Googlebot visita da IP statunitensi, e non esibisce alcuna lingua. Non è che gli viene presentata da indicizzare la versione it/GB, e questa è presentata come canonica?
    (nota che comunque il canonical è un "forte consiglio", il motore di ricerca potrebbe decidere di ignorarlo qualora ritenesse fosse mal configurato)

    Si ho provato e quello che mi restituisce GWT è:

    HTTP/1.1 302 Found
    Server: AkamaiGHost
    Content-Length: 0
    Location: miosito.com/en.html?cc=US
    Date: Tue, 20 Jan 2015 16:40:04 GMT
    Connection: keep-alive

    Quindi mi restituisce la versione inglese a causa del redirect 302.


  • Moderatore

    @panto_ads said:

    ...
    Quindi mi restituisce la versione inglese a causa del redirect 302.
    Il redirect è concepito per tutte le lingue/nazioni o ve n'è una che è considerata di default e per essa non c'è redirect (e i contenuti sono presentati nell'indirizzo di root)?

    Se ogni caso lingua/nazione fosse redirezionato con un 302, quale coppia lingua / nazione desideri sia presentata in SERP da Google associata all'indirizzo di root?
    In tale caso, fai uso di hreflang="x-default"?


  • User Newbie

    Il redirect è concepito per tutte le lingue/nazioni o ve n'è una che è considerata di default e per essa non c'è redirect (e i contenuti sono presentati nell'indirizzo di root)?

    Il redirect 302 è concepito per tutte le lingue/nazioni. Poi è Akamai (il server) che indirizza l'utente tramite ip sulla homepage corretta per countryh e lingua di riferimento, che nel caso dell'Italia è it/IT.

    Se ogni caso lingua/nazione fosse redirezionato con un 301, quale coppia lingua / nazione desideri sia presentata in SERP da Google associata all'indirizzo di root?

    Dipende dal country in cui sto facendo la ricerca. Se è l'Italia e sto quindi cercando su google.it, la homepage che dovrebbe essere presente in SERP è quella miosito.com/it/IT

    In tale caso, fai uso di hreflang="x-default"?
    In quale caso intendi?


  • Moderatore

    @panto_ads said:

    In quale caso intendi?
    Intendevo proprio nel caso il redirect 302 (inavvertitamente avevo scritto 301, ho corretto il post precedente) fosse applicato per ogni coppia lingua/nazione, come mi hai confermato essere.

    @panto_ads said:

    Dipende dal country in cui sto facendo la ricerca. Se è l'Italia e sto quindi cercando su google.it, la homepage che dovrebbe essere presente in SERP è quella miosito.com/it/IT
    Dubito tu possa riuscire a ottenenere un la capacità di distinguere google.it da google.com o comunque un comportamento diverso per Nazione, ma gli strumenti con cui operare sono sicuramente hreflang="x-default" per specificare la neutralità dell'indirizzo di root, ed eventualmente la geolocalizzazione per cartelle per distinguere per nazione.

    Su hreflang="x-default" un punto di partenza è questa pagina:
    https://support.google.com/webmasters/answer/189077?hl=it

    Per selettori di lingua/Paese o le home page con reindirizzamento automatico, devi aggiungere un'annotazione anche per il valore "x-default" di hreflang:
    <link rel="alternate" href="http://example.com/" hreflang="x-default" />

    Pilotare un diverso comportamento in SERP per Nazione (senza discriminare tra ricerche su google.it e google.com) è normalmente invece affidato alla geo-localizzazione impostata su GWT. Però il tuo caso è pernicioso perché le cartelle di Nazione sono impostate al di sotto delle cartelle per lingua.

    Puoi specificare se attualmente usi x-default per l'indirizzo di root?


  • User Newbie

    Intendevo proprio nel caso il redirect 302 (inavvertitamente avevo scritto 301, ho corretto il post precedente) fosse applicato per ogni coppia lingua/nazione, come mi hai confermato essere.

    Allora il processo esatto consiste nel fatto che ogni url del tipo miosito.com/xyz.html con xyz di lunghezza variabile da 2 a 5 (esempio xyz=ita,eng,...) viene 301 reindirizzato a miosito.com. A quel punto è Akamai che lancia un redirect 302 e manda a miosito.com/it.html?cc=IT nel caso dell'Italia.

    Il primo redirect 301 è stato messo poiché c'era un problema di country, nel senso che veniva assegnata correttamente la lingua ma il country veniva impostato su GB di default per ogni lingua.

    Dubito tu possa riuscire a ottenenere un la capacità di distinguere google.it da google.com o comunque un comportamento diverso per Nazione, ma gli strumenti con cui operare sono sicuramente hreflang="x-default" per specificare la neutralità dell'indirizzo di root, ed eventualmente la geolocalizzazione per cartelle per distinguere per nazione.
    Su hreflang="x-default" un punto di partenza è questa pagina: support.google.com/webmasters/answer/189077?hl=it

    Al momento in sitemap non è presente l'hreflang="x-default" per l'indirizzo miosito.com poichè in realtà in sitemap non sono state inserite le diverse URL della homepage al variare di lingua e country (come ad esempio miosito.com/it.html?cc=IT, miosito.com/eng.html?cc=EN, miosito.com/fr.html?cc=FR, ecc). Dici che il problema si possa risolvere aggiungendo all'interno della sitemap queste URL con relative versioni alternative e con la dicitura "x-default" per miosito.com?


  • Moderatore

    Scusa mi sono perso.
    Intendi dire che qualsiasi invocazione a un URL di una certa lunghezza si becca prima un 301 e poi in 302?

    Non conosco Akamai, puoi fare un paio di esempio sulla catena di redirect per una chiamata a root e per una chiamata a pagina interna?