• User Attivo

    URL sito russo

    Ciao a tutti, sto replicando un sito dall'inglese in lingua russa e trovo difficoltà nella generazione delle url parlanti.

    È scontato che non posso usare caratteri cirillici nelle url per una questione di codifica, ma volevo sapere se ci sono soluzioni alternative.

    In particolare se con wordpress è possibile gestire una decodifica delle url con caratteri "strani"?

    Grazie del supporto


  • User

    Ciao!

    Allora, di solito noi usiamo il plugin che si chiama Rus 2 Lat ed converte in automatico le parole in cirillico alle URL in latino.

    Praticamente la parola :

    Италия messa come titolo diventa " Italiya" sulla URL. In questo modo tranquillamente puoi postare la tua URL senza caratteri strani ecc ecc.

    Dal punto di vista SEO Yandex lo accetta senza problemi, quindi vai tranquillo.

    Ti lascio il link su quello che usiamo noi di solito wordpress.org/plugins/cyr2lat/

    Markiyan


  • User Attivo

    Grazie Mark****ian, gentilissimo!


  • User Attivo

    Ho fatto una velocissima ricerca su Google proprio cercando la keyword [Италия] postata da Markian ed ho trovato come primo risultato la versione di wikipeadia che ha un'URL parlante ru.wikipedia.org/wiki/Италия che apre la pagina senza problemi di sorta.

    Non mi sembra aver notato la codifica generata dal plugin "Rus 2 Lat" sopra menzionato, né la sostituzione con le entità codificate per gli URL.

    Spero che possa tornare utile.


  • User

    Ciao MenteLibera. Bhe mi paragoni Wikipedia ad un sito web normale. Wiki poteva avere anche una URL con scritto wiki.ru/noncliccarcisopra e usciva sopra.

    Ti invito a fare una ricerca commerciale, per esempio Riccone Hotels in Russo per esempio così yandex.ru/yandsearch?lr=213&text=Риччоне+отель&csg=0%2C908%2C13%2C1%2C0%2C0%2C0 e vedi che in quella SERP io di URL in cirillico non ne vedo molti. Si, si tratta di briciole di pane presenti la le URL sono tante in latino.

    In più, come osservazione la URL cirillica pura non è codificata e quando andiamo a fare LB è abbastanza pesante in quanto una URL lunga 10 cm di testo, come per esempio : %D1%86%D0%B2%D0%B5%D1%82%D0%B0-%D0%BD%D0%B0%D1%81%D1%82%D1%80%D0%BE%D0%B5%D0%BD%D0%B8%D1%8F-%D0%B8%D0%BB%D0%B8-%D0%BE%D0%B4%D0%B5%D0%B6%D0%B4%D0%B0/

    E' poco pratica e poco estetica 🙂

    Spero di aver chiarito il bisogno.

    Markiyan Yurynets


  • User Attivo

    Ciao Markian, probabilmente conosci più di me il russo che non ho avuto modo di studiare.

    Nel passato in altri contesti avevo trovato dei file in cirillico ed il filename non presentava alcuna codifica. Per varie ragioni non posso pubblicare un esempio di nome del file perché potrebbe essere in contrasto con il regolamento del forum, forse dovrei trovare qualche immagine satellitare o di una stazione spaziale russa, ma non ho molta fantasia sul cosa dare in pasto alla ricerca per immagini di Google.

    Ho cercato negli standard del web e probabilmente la RFC 3987 sembra quella che più si avvicina alle nuove codifiche degli indirizzi, da una velocissima sbirciata sembra darti ragione.


  • Moderatore

    Scusate, la vedo un po' differente.

    Di siti con URL con caratteri non ascii ne trovo parecchi, in tutte le lingue, anche con caratteri in Cirillico.
    Sospetto l'uso della transliterazione in caratteri latini del cirillico sia un retaggio del passato. Sia i motori di ricerca che i browser sono da tempo in grado di gestirli senza problemi facendo in modo trasparente o quasi la codifica in "percent encoding" (quello con tutti i segni percentuali e i numeri esadecimali, per intendersi).

    Gli URL nei link possono essere tranquillamente scritti nel codice HTML nella forma nativa p.es. in cirillico (supponendo di avere le pagine in Unicode UTF-8), facilmente leggibile; sarà il browser tradurlo in formato percent-encoded così da farlo viaggere "sul filo" in un formato compatibile con le specifiche degli URL in modo trasparente all'utente. Anche la barra degli indirizzi del browser mostrerà il formato "human friendly".

    Per quanto riguarda Google, un po' di riferimenti ufficiali:

    Notare gli stessi concetti valgono per i nomi di dominio in formato IDN, possono essere scritti con i caratteri nativi e sarà il browser a fare la trasposizione punycode in modo trasparente al momento di fare la chiamata HTTP.

    Per fare un esempio (non ho alcuna affiliazione con il sito, è solo il primo esempio mi è capitato):
    posso scrivere <a href="//экскурсии.рф/заказ-такси">link</a> con caratteri Unicode, e ormai tutti i browser sono in grado da soli di tradurre in:
    //экскурсии.рф/заказ-такси

    Non ho sufficiente esperienza sui mercati di lingua Russa per dire se sia più "premiato" un URL in formato cirillico o con translitterazione latina - ossia /заказ-такси rispetto a /zakaz-taksi (Markyan mi perdoni l'ignoranza linguistica) - ma sospetto la versione in cirillico sia il più probabile candidato sia per un "matching" con gli algoritmi di ricerca, sia per presentarsi più accattivante all'utente in che lo vede in SERP con il proprio alfabeto.

    Va tenuto anche presente che se per l'alfabeto cirillico esiste una transliterazione in caratteri latini (detta anche "romanizzazione"), ciò non è altrettanto vero per i caratteri arabi, persiani, cinesi, giapponesi, vietnamiti, etc...) ove l'uso di URL "all'inglese" usato come accorgimento storico non è una soluzione che sfrutti al massimo le possibilità offerte. Difficile credere i motori di ricerca non ne tengano conto.

    Ripeto, penso l'evitare i caratteri particolari negli URL (a parte lo spazio, ma questa è un'altra storia) negli URL faccia parte di quelle cose una volta necessarie, ora non più, ma che consuetudini dure a morire.