• User Attivo

    [WMT] pagine index "lette" due volte: canonical?

    Buongiorno

    Ho un sito in 5 lingue nel quale, per ogni lingua, è stata creata un'apposita cartella (www.nomesito.ext/en, www.nomesito.ext/fr, ecc.) ognuna avente all'interno un documento index.html.
    Controllando il sito con gli strumenti per webmaster di Google, nella sezione ottimizzazione > miglioramenti HTML, mi vengono segnalate le pagine con i tag title duplicati.
    Il fatto strano è che le pagine segnalate sono in realtà la stessa, ovvero www.nomesito.ext/en/ e www.nomesito.ext/en/index.html, questo per ogni lingua.
    Come posso fare per evitare che Google veda due volte la stessa pagina segnalandomi di conseguenza dei contenuti duplicati?
    E' sufficiente utilizzare rel="canonical" in ogni index.html?

    Grazie


  • Moderatore

    Ciao Eugene.
    No, non è sufficiente il rel=canonical, che rappresenta un'indicazione per Google, che tra l'altro potrebbe anche ignorare. In questo caso non c'entra, però. Devi segnalare il multilingua sia nell'HEAD (tramite un link rel alternate con hreflang) sia nella sitemap. Anche dopo tale modifica, però, Google potrebbe ancora segnalare la cosa. Puoi provare a modificare i TITLE nelle altre lingue lasciando i titoli visibili come sono ora.


  • User Attivo

    Ciao FDA.

    Vediamo se ho ben compreso, nell'index di ogni lingua devo inserire i seguenti tag:

    <link rel="alternate" hreflang="en" href="http://www.nomesito.ext/en/" />
    <link rel="canonical" href="http://www.nomesito.ext/en/"/>
    

    Non mi è chiara la questione riguardante la sitemap poiché questa viene generata automaticamente tramite software, devo intervenire manualmente ed apportare delle modifiche?
    Anche quello che dici sui title mi è poco chiaro. Al momento il sito presenta title e description differenti per ogni pagina e per ogni lingua. Cosa andrebbe fatto?

    Grazie


  • Moderatore

    Ciao Eugene.
    Sì, le due istruzioni che hai suggerito sono corrette nella forma (a meno dello slash finale, quello dipende dalla versione dell'html), ma non vanno insieme.
    Mi spiego: la prima indica la lingua alternativa, la seconda indica invece la pagina "canonical" nella lingua attuale. La prima andrà pertanto nelle pagine corrispondenti in una lingua diversa da quella inglese, la seconda nella sola pagina in lingua inglese. Questo vale per tutte le lingue. Il codice deve essere ovviamente generato, perché gli URL cambiano da pagina a pagina (esempio: la home e un articolo hanno due URL diverse ... perdona se ho scritto un'ovvietà).

    Per la sitemap dovresti capire se sta generando anche le alternative per la lingua inglese. Considera che esistono modi diversi di generare le sitemap, di seguito te ne suggerisco uno.

    Quello che segue è un esempio di url disponibile in lingua italiana e inglese:

    <url>            <loc>http: //www .tuodominio.com/it/pagina</loc>
                <xhtml:link
                    rel="alternate"
                    hreflang="it"
                    href="http: //www .tuodominio.com/it/pagina"
                    />
                <xhtml:link
                    rel="alternate"
                    hreflang="en"
                    href="http: //www .tuodominio.com/en/pagina"
                    />
                <lastmod>2013-04-18</lastmod>
                <changefreq>weekly</changefreq>
                <priority>0.7</priority>
            </url>
    

    Nel caso in esame le versioni nelle diverse lingue si trovano in sottocartelle, come si evince dalla struttura degli url. Le istruzioni alla fine (lastmod, changefreq e priority) sono facoltative. Puoi anche aggiungere video e immagini nella stessa sitemap. In alternativa puoi creare sitemap diverse sia per le lingue sia per video e immagini.

    Ultima cosa: controlla la generazione della sitemap (non so se usi WordPress o altro CMS o comunque plugin per il tuo sito, qualunque sia la piattaforma), a volte viene supportato il multilingua e basta soltanto impostarlo.

    Spero di esserti stato utile.
    Saluti.:ciauz:
    Francesco


  • Moderatore

    Ciao Eugene,
    @Eugene said:

    Controllando il sito con gli strumenti per webmaster di Google, nella sezione ottimizzazione > miglioramenti HTML, mi vengono segnalate le pagine con i tag title duplicati.
    Il fatto strano è che le pagine segnalate sono in realtà la stessa, ovvero www .nomesito.ext/en/ e www .nomesito.ext/en/index.html, questo per ogni lingua.
    Oltre all'uso del canonical, andrei a verificare se link-i alle pagine in modo consistente: googlebot ha visitato entrambe le versioni degli URL, da qualche parte li ha letti. Lo stesso ha probabilmente fatto il software usato per generare la sitemap.


  • Moderatore

    Buongiorno.
    Aggiornamento sul title.
    Il TITLE è quello definito nell'HEAD tra i tag <title> e </title>: è quello che leggi nelle SERP e in alto nella scheda del browser ed è quello che viene controllato in merito ai duplicati.
    Il "titolo" è quello (eventualmente) presente nella pagina, solitamente inserito in un tag H1 (o, in generale, H1-H6).
    Alcune estensioni SEO-SEF (ad esempio Yoast WordPress SEO) consentono facilmente di definire diversamente e direttamente dal backend titolo seo (TITLE) e titolo della pagina/articolo. Un esempio di utilizzo: TITLE di max. 70 caratteri (corrispondenti al numero max. di pixel accettati da Google) e titolo H1 più lungo.