Salve Cantodinverno.
Lo spunto per la discussione che mi dai è ottimo e mi permette di approfondire alcuni punti salienti. 
La spiegazione è un po' lunga, ma spero aiuti a dare qualche coordinata in più.
Comincio dal problema dell'appiattimento della lingua: in parte è vero, la collezione degli schemi proposti tende ad appiattire un po' tutto o, forse meglio, a "inscatolare" la ricchezza delle parole e dei mezzi di comunicazione in una trama dalle maglie inevitabilmente troppo larghe o troppo strette, incapaci di stare davvero "a pennello" a un contenuto.
Si tratta però di un problema comune quando occorre fare una classificazione, proprio come accade negli archivi o nelle biblioteche (da cui il mio riferimento alla classificazione decimale Dewey): si ritiene in particolare che i benefici derivanti dall'inserimento delle pagine web in una complessità strutturata e adeguata a uno standard universale superi in ogni caso la perdita dovuta allo smarrimento del prezioso residuo non compensato tra il singolo ente (frase, pensiero, concetto) e la classe, l'insieme o il gruppo in cui esso viene convogliato.
Ogni mela in questo mondo è diversa da tutte le altre e come tale andrebbe considerata nella sua unicità essenziale e perfino inesprimibile a parole, ma il fatto di inserirla ("imprigionarla") nella macro-categoria "mela" ci fa guadagnare tempo quando, dal fruttivendolo, chiediamo un chilo di mele invece di indicare ogni frutto e dire «voglio questo ente, quest'altro, quest'altro ancora».
Se questo risparmio di tempo / denaro / fatica / altro a beneficio della perdita di informazione e profondità sia una cosa positiva o negativa non è compito di chi scrive giudicarlo; è però un dato di fatto che su questo metodo si basi buona parte della nostra comunicazione verbale e scritta (e tutto quanto a ciò è legato).
Per quel che riguarda invece nello specifico il modello proposto da Schema.org, ci tengo a sottolineare che non si tratta di un modo nuovo di concepire i contenuti multimediali, ma soltanto di un protocollo iper-specializzato volto alla classificazione delle informazioni visibili ad occhio umano (diversamente da altre cose, come parte degli script che generano le animazioni), a beneficio di una loro più facile indicizzazione.
Un esempio tratto dal sito ufficiale chiarirà il tutto. Supponiamo di avere, in una nostra pagina web che parla di videogiochi, la seguente scheda/recensione (realizzata con un'opportuna sequenza di div e altre "scatole" nel codice html scritto da zero o generato da linguaggi vari):
Codice HTML:
Resistance 3: Fall of Man
by Sony
Platform: Playstation 3
Rated: Mature
Il bot del motore di ricerca assorbe le informazioni, le correla ad altre e "scopre" che la prima riga è il titolo del gioco, la seconda il nome del produttore (lo aiuta probabilmente la preposizione "by"), la terza la consolle sulla quale farlo girare e la quarta la fascia di utenza consigliata.
Se si decide di adattare tale contenuto agli standard di Schema.org, ecco cosa si dovrà inserire nel codice della medesima pagina, a proposito del medesimo argomento:
Codice HTML:
<div itemscope itemtype="http://schema.org/CreativeWork">
<img itemprop="image" src="videogame.jpg" />
<span itemprop="name">Resistance 3: Fall of Man</span>
by <span itemprop="author">Sony</span>,
Platform: Playstation 3
Rated:<span itemprop="contentRating">Mature</span>
</div>
La sintassi di "itemprop" aiuta il bot (non il visitatore, il quale vede di fatto sempre le stesse informazioni sullo schermo) a discernere con maggiore chiarezza di quale tipo di opera d'ingegno ("creativework" dentro "itemtype") si tratti e di quali informazioni su di essa vengano fornite da chi ha creato la pagina web.
Altro esempio che si spiega da sé: ecco come modificare una pagina che originariamente parla di libri e dà una recensione per Il giovane Holden di Salinger:
Codice HTML:
<a href="category/books.html">Books</a> >
<a href="category/books-literature.html">Literature & Fiction</a> >
<a href="category/books-classics">Classics</a>
<img src="catcher-in-the-rye-book-cover.jpg" />
The Catcher in the Rye - Mass Market Paperback
by <a href="/author/jd_salinger.html">J.D. Salinger</a>
4 stars - 3077 reviews
Price: $6.99
In Stock
Product details
224 pages
Publisher: Little, Brown, and Company - May 1, 1991
Language: English
ISBN-10: 0316769487
Reviews:
5 stars - <b>"A masterpiece of literature" </b>
by John Doe. Written on May 4, 2006
I really enjoyed this book. It captures the essential challenge people face
as they try make sense of their lives and grow to adulthood.
4 stars - <b>"love it LOLOL111!" </b>
by Bob Smith, Written on June 15, 2006
Catcher in the Rye is a fun book. It's a good book to read.
Il predetto codice va così modificato:
Codice HTML:
<body itemscope itemtype="http://schema.org/WebPage">
...
<div itemprop="breadcrumb">
<a href="category/books.html">Books</a> >
<a href="category/books-literature.html">Literature & Fiction</a> >
<a href="category/books-classics">Classics</a>
</div>
<div itemscope itemtype="http://schema.org/Book">
<img itemprop="image" src="catcher-in-the-rye-book-cover.jpg" />
<span itemprop="name">The Catcher in the Rye</span> -
<link itemprop="bookFormat" href="http://schema.org/Paperback">Mass Market Paperback
by <a itemprop="author" href="/author/jd_salinger.html">J.D. Salinger</a>
<div itemprop="aggregateRating" itemscope itemtype="http://schema.org/AggregateRating">
<span itemprop="ratingValue">4</span> stars -
<span itemprop="reviewCount">3077</span> reviews
</div>
<div itemprop="offers" itemscope itemtype="http://schema.org/Offer">
Price: <span itemprop="price">$6.99</span>
<meta itemprop="priceCurrency" content="USD" />
<link itemprop="availability" href="http://schema.org/InStock">In Stock
</div>
Product details
<span itemprop="numPages">224</span> pages
Publisher: <span itemprop="publisher">Little, Brown, and Company</span> -
<meta itemprop="publishDate" content="1991-05-01">May 1, 1991
Language: <span itemprop="inLanguage">English</span>
ISBN-10: <span itemprop="isbn">0316769487</span>
Reviews:
<div itemprop="reviews" itemscope itemtype="http://schema.org/Review">
<span itemprop="reviewRating">5</span> stars -
<b>"<span itemprop="name">A masterpiece of literature</span>" </b>
by <span itemprop="author">John Doe</span>,
Written on <meta itemprop="publishDate" content="2006-05-04">May 4, 2006
<span itemprop="reviewBody">I really enjoyed this book. It captures the essential
challenge people face as they try make sense of their lives and grow to adulthood.</span>
</div>
<div itemprop="reviews" itemscope itemtype="http://schema.org/Review">
<span itemprop="reviewRating">4</span> stars -
<b>"<span itemprop="name">A good read.</span>" </b>
by <span itemprop="author">Bob Smith</span>,
Written on <meta itemprop="publishDate" content="2006-06-15">June 15, 2006
<span itemprop="reviewBody">Catcher in the Rye is a fun book. It's a good book to read.</span>
</div>
</div>
...
</body>
Lo sforzo richiesto ai creatori di siti web e webmaster non è da poco, a meno che non si implementi un qualche utile script per generare in modo semi-automatico molte strutture, magari pescando da database già esistenti.
Tuttavia, il vantaggio che si ottiene è quello di creare una pagina semanticamente impeccabile, dove c'è un posto per ogni cosa e ogni cosa sta al suo posto – al netto di quella perdita essenziale di certe minime sfumature di cui si diceva all'inizio.
[Premesso che, meta-dati di classificazione a parte, resta ancora tutto lo spazio che si aveva prima per far volare la mente e la penna e scrivere testi ricchi, complessi, pieni di dettagli e rimandi incrociati, ai quali la presenza dei micro-formati non toglie nulla, semmai arricchisce appunto di meta-informazioni.]
E qui torniamo al pensiero iniziale di Cantodinverno: ci sono settori in cui l'applicazione sistematica di questa nuova sintassi concordata potrebbe portare straordinari benefici (due esempi su tutti: Wikipedia e l'IMDB, il mega-database dei film, ma anche giornali on-line e tutti i siti di consultazione), mentre magari per piccoli siti il gioco non varrebbe la candela, perché forse gli attuali spider hanno già tutto il necessario per capire di cosa parla il sito senza bisogno di appesantirlo con tutto questo lavorio classificatorio minuzioso e un po' pedante.
La domanda si ripropone: cosa ne pensate voi di questa "rivoluzione in sordina"?
Ne hanno parlato poco perché alla fine vinceranno la pigrizia dei webmaster e la crescente intelligenza dei bot, o perché solo tra qualche tempo, con le prime applicazioni su vasta scala a mezzo di script semi-automatizzati, potremo finalmente apprezzare il genio che sta dietro a questa colossale meta-alberatura dei contenuti della Rete? | | | |
| | HTML | HTML (HyperText Markup Language) nasce per mano di Tim Berners-Lee, il costruttore del primo webserver e del primo browser, come estensione di SGML (Standard Generalized Markup Language) nel 1990. | | |
| | | |
| | | |
| | Link | Collegamento Ipertestuale | | |
| | | |
| | | |
| | Spider | Software utilizzato dai motori di ricerca per il prelevamento di indirizzi di documenti web | | |
| | | |
| | | |
| | Sistematica | In ambito scientifico, qualsiasi metodo per ordinare una collezione di conoscenze in un sistema.
Anche, ramo della Biologia che classifica gli organismi vegetali o animali secondo le affinità fra specie diverse. | | |
| | | |
| | | |
| | Protocollo | Nell'ambito delle telecomunicazioni metodologia eletta a standard che permette la comunicazione tra almeno due host o macchine inter-connesse ad una rete (v. 'Protocollo di rete'). In ambito diplomatico, l'insieme delle formule di esordio di un documento che precedono il testo vero e proprio. Registro in cui i notai trascrivono gli estremi degli atti da essi stilati. Documento attestante un accordo tra Stati. Insieme delle norme che regolano lo svolgimento di manifestazioni, visite, ricevimenti ufficiali. | | |
| | | |