• User Newbie

    Contenuti duplicati tra domini differenti .com e .cn

    Ciao ragazzi,

    vi espongo un caso particolare che mi trovo a dover gestire per chiedervi gentilmente un parere e un confronto su come gestire al meglio la situazione.

    In pratica, ho un sito miosito.com in inglese che da poco è stato duplicato ed è stato tradotto in cinese e messo su dominio miosito.cn. Su questo nuovo dominio è stata comunque mantenuta la versione inglese, quindi dominio.cn/en/, con contenuti quindi completamente duplicati. Si è optato per due versioni in inglese .com e .cn/en/ per rendere disponibile e facilmente navigabile la versione in inglese anche agli utenti cinesi, dato che in Cina alcuni social sono bloccati, così come altre funzionalità che utilizza il sito .com (es. Google Fonts).

    Come gestire quindi questa situazione in modo da non far percepire ai motori questa duplicazione di contenuti? A me vengono in mente queste soluzioni:

    1. Su miosito.cn, inibire l'accesso alla versione inglese del sito .cn a googlebot da robots.txt e viceversa su miosito.com
    2. Inserire nelle pagine di miosito.cn il tag <meta name="googlebot" content="noindex, nofollow" /> e viceversa su miosito.cn
    3. Inserire in miosito.cn il rel="canonical" alle corrispondenti pagine del .com

    Ora, personalmente opterei per la soluzione 1, ma vorrei confrontarmi con voi per capire se c'è una soluzione preferibile.

    Grazie mille 🙂


  • Moderatore

    Ciao Andre_Bee,

    @Andre_Bee said:

    Come gestire quindi questa situazione in modo da non far percepire ai motori questa duplicazione di contenuti? A me vengono in mente queste soluzioni:

    1. Su miosito.cn, inibire l'accesso alla versione inglese del sito .cn a googlebot da robots.txt e viceversa su miosito.com
    2. Inserire nelle pagine di miosito.cn il tag <meta name="googlebot" content="noindex, nofollow" /> e viceversa su miosito.cn
    3. Inserire in miosito.cn il rel="canonical" alle corrispondenti pagine del .com

    Ora, personalmente opterei per la soluzione 1, ma vorrei confrontarmi con voi per capire se c'è una soluzione preferibile.
    La soluzione 3 la scarterei, rel="canonical" sarebbe letto anche dai motori di ricerca cinesi e perdereste lo scopo principale di indirizzare utenti Cinesi che cercano i contenuti in inglese verso la versione .cn/en/

    Vi è anche una quarta strada - la aggiungo per completezza - che è l'uso di alternate/hreflang con valore hreflang="en-CN". Per Google funzionerebbe. Presuppone che gli utenti cinesi di .cn/en/ abbiano impostato il browser in Inglese, e che il desiderio sia effettivamente di indirizzarli verso .cn/en/
    Non conosco il livello di supporto di hreflang da parte dei motori di ricerca cinesi, sospetto non la supportino il ché escluderebbe al 4.

    Gli utenti del sito .cn/en/ da che motore di ricerca ci arrivano?
    Questa statistica ti potrebbe tornare utile per prendere decisioni:
    http://gs.statcounter.com/search-engine-market-share/all/china/#monthly-201512-201612-bar
    Si vede chiaramente che il mercato cinese è dominato per almeno il 95% da motori cinesi. Google ha poco più del 2% (che in numeri assoluti è comunque una fetta di tutto rispetto data la dimensione del mercato cinese).

    Con gli elementi hai fornito, anch'io sarei propenso per la soluzione 1, o 2 (bisognerebbe anche sapere se Google ha già indicizzato .cn/en/, nel caso andrei prima sulla 2 e una volta de-indicizzato imposterei il blocco a googlebot anche in robots.txt). Ho una conoscenza parziale del problema, nuovi elementi potrebbero farmi cambiare idea 🙂

    Spero d'esserti stato utile.


  • User Newbie

    Ciao Federico,

    innanzitutto, grazie mille per la tua risposta e per i preziosi spunti che mi hai fornito. Ti rispondo qui sotto con degli altri dettagli 🙂

    @FedericoSasso said:

    Con gli elementi hai fornito, anch'io sarei propensoper la soluzione 1, o 2 (bisognerebbe anche sapere se Google ha giàindicizzato .cn/en/, nel caso andrei prima sulla 2 e una voltade-indicizzato imposterei il blocco a googlebot anche inrobots.txt)

    No, Google non ha indicizzato il .cn/en/ perché questa versione del sito non è stata ancora messa online.

    @FedericoSasso said:

    Gliutenti del sito .cn/en/ da che motore di ricerca ci arrivano?
    Questa tatistica ti potrebbe tornare utile per prendere decisioni:
    Sivede chiaramente che il mercato cinese è dominato per almeno il 95%da motori cinesi. Google ha poco più del 2% (che in numeri assolutiè comunque una fetta di tutto rispetto data la dimensione delmercato cinese).

    Per questo progetto mi sto concentrando prevalentemente sull'ottimizzazione per i motori di ricerca Cinesi che di fatto dominano il mercato come si vede dalle tue statistiche. La tua opzione 4 però mi ha dato un importante spunto per ottimizzare il sito anche per Google (vedi sotto).

    @FedericoSasso said:

    Viè anche una quarta strada - la aggiungo per completezza - che èl'uso di alternate/hreflang con valore hreflang="en-CN".Per Google funzionerebbe.Presuppone che gli utenti cinesi di .cn/en/ abbiano impostatoil browser inInglese, e che il desiderio sia effettivamente di indirizzarli verso.cn/en/
    Nonconosco il livello di supporto di hreflang da parte dei motoridi ricerca cinesi,sospetto non la supportino il ché escluderebbe al 4.

    Sì ho idea anche io che non sia supportato, ma provo ad indagare in tal senso. Sarebbe un'ottima soluzione per Google in quando indicherei .cn/en/ come variante al .com per gli utenti cinesi che usano Google, scongiurando così il problema dei contenuti duplicati. A questo punto, anche se l'hreflang non fosse supportato dai motori cinesi poco importa secondo me, posso inibire l'accesso al .com ai loro spider, risolvendo lo stesso problema ma dall'altra parte. Potrebbe funzionare?

    Ancora grazie mille per il tuo prezioso aiuto Federico 🙂


  • Moderatore

    @Andre_Bee said:

    A questo punto, anche se l'hreflang non fosse supportato dai motori cinesi poco importa secondo me, posso inibire l'accesso al .com ai loro spider, risolvendo lo stesso problema ma dall'altra parte. Potrebbe funzionare?
    Sì. Ciao 🙂