XML sta per eXtensible Markup Language ed è uno standard di descrizione di documenti usato per definire altri linguaggi. Inventato dal W3C con a capo dell'operazione Tim Berners Lee l'inventore dell'HTML.

Un pò di storia

L'XML fece la sua prima comparsa nel 1996 in seguito alla decisione del W3C di porre fine al conflitto tra le varie case prodruttrici di software che applicavano ai propri browser specifiche differenti riguardanti l'HTML utilizzato. Il web stava pian piano entrando nelle case di tutti, si doveva trovare un linguaggio che fosse al parti del SGML (Standard Generalized Markup Language) ma più semplice da utilizzare, più flessibile, soprattutto per gli sviluppatori. Nacque così l'XML che riuscì con la sua semplicità di utilizzo ad imporsi presto sul mercato e a rendere il web più compatto, evitando così le varie interpretazioni personali di un sito web da parte dei browser utilizzati in quel determinato periodo. L'introduzione dell' XML non fece cessare del tutto l'anarchia che regnava nell'applicare estensioni "proprietarie" da parte delle case prodruttrici, ma riuscì a stabilire quali tag potevano essere applicati e quali invece dovevano essere abbandonati. Accedere ad un sito da vari navigatori divenne più semplice, strutturarlo rispettando gli standard voleva dire sapere come sarebbe stato visualizzato. Ancora oggi è così. L'essere un linguaggio astratto e quindi un linguaggio di marcatura completamente personalizzabile, ma mai inrispettoso degli standard, viene utilizzato anche per passare dati o definire documenti. Da lui nasce anche l'XHTML, linguaggio di markup che man mano sta sostituendo l'HTML.

E' inoltre importante capire la definizione di ' documento XML '. Questo termine si riferisce ad una collezione di contenuti che rispettano delle regole ben precise durante la sua creazione. Quando si lavora con l' XML, il termine documento ha un significato più generale rispetto a quello di un software. Infatti di solito consideriamo un file XML come un file fisico, esistente, mentre un file XML può essere un solo file che esiste fisicamente ma anche più files insieme. Può anche essere una condivisione di informazioni che fisicamente non esiste. Si possono creare queste condivisioni usando degli scripts lato server.

Un file XML correttamente formattato, ha a disposizione le seguenti marcature: - Elemento( alcuni lo chiamano nodo ), che è definito come la massa del documento XML. Un elemento contiene 2 tags e del testo. Gli elementi possono includere altri elementi. Possono essere vuoti ( cioè senza testo al loro interno ). Il termine elemento ed il termine tag hanno due significati ben distinti. Questo è un tag: <nomeTag>, questo è un elemento: <nomeTag> testo </nomeTag>. Un elemento vuoto può essere definito in 2 modi: <nomeTag></nomeTag> oppure semplicemente <nomeTag/>. Entrambe le soluzioni sono accettabili e quindi mantengono corretto il documento. Un elemento può avere un nome che inizia con qualsiasi carattere, ma non può iniziare con un numero e non può contenere spazi. Un classico esempio: <nome>Filippo</nome>. Quando un elemento contiene un altro elemento, vengono definiti ' genitore ' e ' figlio ': <genitore> <figlio>Filippo</figlio> </genitore> Il primo elemento di un documento XML è definito root element e contiene tutti gli altri elementi del documento. Un documento XML può avere una sola root. Il linguaggio XML è case sensitive, quindi distingue lettere maiuscole dalle minuscole. Questa è una sostanziale diferenza con l' HTML. Un errore molto grave sarebbe utilizzare la seguente sintassi: <nomeTag>Filippo</nometag>, che porterebbe ad una non coretta formattazione del documento. -Attributo: gli attributi forniscono informazioni aggiuntive agli elementi e sono posizionati all' interno del tag dell' elemento ma dopo il nome dell' elemento, come da esempio seguente: <nomeTag nomeAttributo="valoreAttributo">Filippo</nomeTag> Un attributo deve essere separato dal nome dell' elemento con uno spazio,deve avere un segno uguale ( = ) prima del valore dell' attributo ed il valore dell' attributo deve essere compreso tra virgolette. I tags non possono essere inclusi all' interno di un attributo. Non ci sono limiti di quantità di attributi all' interno di un elemento ma devono avere tutti nomi unici. I nomi degli attributi non possono iniziare con un numero e non possono contenere spazi. - Testo, inteso come qualsiasi informazione contenuta tra i due tags di un elemento. Caratteri speciali nel testo devono essere tradotti con delle entità, esempio: il carattere < corrisponde a entità < ed il carattere > corrisponde a entità > - Entità , come abbiamo visto sono un insieme di caratteri che vanno a sostituire i caratteri speciali all' interno di un testo annidati tra due tags di un elemento. Possiamo utilizzare lo strumento mappa carattere di Windows per individuare le entità che sostituiscono ogni carattere speciale. - Commenti, si comportano allo stesso modo dell' HTML. iniziano coi caratteri . Tuutavia esistono 4 regole fondamentali per cui un documento XML ritiene valido un commento: 1. un commento non può essere scritto prima della riga di dichiarazione di un file XML <?xml version="1.0"?>. 2. I commenti non possono essere inclusi nei tags. 3. non si può includere la stringa --> all' interno di un commento. 4. un commento non deve diviere un tag, si deve commentare o prima o dopo un tag. - CDATA questo tag può contenere al suo interno dei caratteri speciali, può addirittura contenere HTML e viene tradotto come tale. CDATA non viene processato dal compilatore come parte del linguaggio XML. Esempio: <![CDATA[Filippo]]>.


  • Questa pagina è stata modificata per l'ultima volta il 4 giu 2009 alle 21:04.
  • Questa pagina è stata letta 9 754 volte.