+ Rispondi alla Discussione
Risultati da 1 a 4 di 4

Indicizzazione file xml trasformati tramite xslt

Ultimo Messaggio di paocavo il:
  1. #1
    Esperto L'avatar di Gorka
    Data Registrazione
    Apr 2006
    Località
    Ragusa
    Messaggi
    1,678

    Indicizzazione file xml trasformati tramite xslt

    Premessa su XSLT

    XSLT è una tecnologia facente parte della famiglia XML. In poche parole tramite XSL possiamo trasformare un XML per ottenerne un nuovo file (xml, html, svg, testo, ecc...). Non è una tecnologia nuova, è poco conosciuta perchè poco diffusa.
    Per maggiori dettagli http://it.wikipedia.org/wiki/XSL_Transformations oppure una semplice ricerca con la parola XSLT e si trovano diverse guide e how-to. Faccio un esempio così capiamo subito di cosa si tratta.

    Dato il seguente file xml (articolo.xml):

    Codice:
    <?xml version="1.0" encoding="UTF-8"?>
    <?xml-stylesheet href="articolo.xsl" type="text/xsl"?>  
    <documento>
        <titolo>titolo documento</titolo>
        <testo>Questo è un testo di prova XSLT</testo>
        <autore>gianni</autore>
    </documento>
    Mettiamo nella stessa cartella un file xsl (articolo.xsl)
    Codice:
    <xsl:stylesheet version="2.0" 
        xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
        xmlns="http://www.w3.org/1999/xhtml">
    
    <xsl:output  method="html"  indent="yes" />
    
    <xsl:template match="/documento">
        <html>
        <head>
            <title><xsl:value-of select="titolo"/></title>
        </head>
        <body>
            <p>
                <xsl:value-of select="testo" />
            </p>
            <p>
                Autore : <xsl:value-of select="autore" />
            </p>
        </body>
        </html>
    </xsl:template>
    
    </xsl:stylesheet>
    Aprendo il file xml con il browser otterremo questo output:
    Codice:
    <html>
    <head>
        <meta content="text/html; charset=UTF-8" http-equiv="Content-Type">
        <title>titolo documento</title>
    </head>
    <body>
        <p>Questo è un testo di prova XSLT</p>
        <p>Autore : gianni</p>
    </body>
    </html>
    Ma se fate caso, visualizzando la sorgente pagina vedrete ancora l'xml, non l'html generato.

    Il test

    Quindi la mia domanda è: i motori di ricerca come vedono questo XML? Lo leggono come semplice xml o applicano le trasformazioni XSL? E viste le notizie degli ultimi giorni sull'indicizzazione di documenti SVG (altro linguaggio derivato da xml) la cosa si fa interessante.
    Ho fatto un piccolo test alla pagina: http://giannileggio.com
    Se guardate al sorgente è un semplice file xml, anche se il vostro browser visualizza correttamente l'html. Il documento è stato indicizzato, ma in maniera differente da yahoo e goole (su bing ancora non viene fuori).

    Il risultato

    Google indicizza l'xml senza trasformarlo, potete vedere la cache qui: http://webcache.googleusercontent.co...gs_rfai=&pbx=1
    E forse non legge i link presenti all'interno del file. Insomma, come prevedevo, questo tipo di documenti sono mal digeriti da Google allo stato attuale.

    Yahoo, invece, sotto questo aspetto è più evoluto, ecco la cache http://it.search.yahoo.com/search?ei...5Hony7VRxiZQ--
    In pratica applica le trasformazioni xsl! E inoltre ha pure indicizzato la pagina contacts.xml. Questo mi ha stupito, non pensavo i motori arrivassero ad applicare le trasformazioni client-side e invece yahoo lo fa.
    Inoltre nello snippet mostra una description caricata completamente da xsl (cioè è un testo assente nell'xml, è presente solo nel file layout.xsl).
    (c'è anche da vedere cosa accadrà con la "fusione" di yahoo con bing)

    Che succederà in futuro? Io continuo con questo genere di test e di ricerche, speranzoso che questa tecnologia (della quale sono appassionato) venga presto presa in considerazione anche da google. Man mano che ho delle novità terrò informato chi lo volesse (qui sul forum o seguitemi ai link in firma).

  2. #2
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Località
    Monasterace
    Messaggi
    40,145
    Visita il canale Youtube di Giorgiotave
    Gianni grazie per aver postato questo test ed averlo condiviso con tutti noi

    Ho dato io l'autorizzazione a Gianni per farlo

    Vediamo che succede.
    Giorgio Taverniti Blog. FastForward: su YouTube ogni Martedì!

    Tutta la SEO in 23 ore: 9 diversi moduli tematici, 34 lezioni, questo è il Videocorso SEO del 2017!


  3. #3
    ModSenior L'avatar di mister.jinx
    Data Registrazione
    May 2007
    Località
    Toscana
    Messaggi
    8,676
    Segui mister.jinx su Twitter Aggiungi mister.jinx su Google+ Aggiungi mister.jinx su Facebook Aggiungi mister.jinx su Linkedin Visita il canale Youtube di mister.jinx
    Ciao,

    se posso aggiungere una precisazione: l'indicizzazione è la stessa (sempre di XML si tratta). La differenza è l'applicazione del "foglio di stile" xsl e relativa xslt.

  4. #4
    Moderatore L'avatar di paocavo
    Data Registrazione
    Mar 2006
    Località
    Lecce, Italy
    Messaggi
    1,012
    Aggiungi paocavo su Facebook Aggiungi paocavo su Linkedin
    Ottimo, grazie per la condivisione

+ Rispondi alla Discussione

^ Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
  • Il codice BB è Attivato
  • Le faccine sono Attivato
  • Il codice [IMG] è Attivato
  • Il codice [VIDEO] è Attivato
  • Il codice HTML è Disattivato
  • Trackbacks Attivato
  • Pingback Attivato
  • Refback Attivato

SEO by vBSEO 3.6.0 PL2 ©2011, Crawlability, Inc.