• User Attivo

    Piccoli algoritmi semantici crescono

    Ecco un simpatico esempio italiano di algoritmo a base semantica (evidentemente ancora agli inizi ma interessante):

    http://arianna.libero.it/search/abin/integrata.cgi?step=2&query=pesca

    La ricerca della parola "pesca" porta ad una sucessiva possibile selezione tra varie aree di senso differenti:

    "pesca come Cattura degli animali, pesca come Frutto del pesco di forma sferica, pesca come Quantità di pesce"

    ciauz,
    Lucas 😉


  • Bannato User Attivo

    Interessante.


  • User Attivo

    Credo che libero con questo sito stia dando un contributo qualitativo all'utente, ma parlare di semantica è troppo.
    Libero, data la ricerca delle key inserite nel form d ricerca, fa una select nel vocabolario della lingua italiana e dati i molteplici risultati di una parola, suggerisce più varianti.

    Se proviamo a mettere "pannelli solari", Libero individua in primis la parola "pannelli" che posta in singolare diventa "pannello", ed ecco le varianti del termine:

    -> panello come Mattonella - agricoltura

    Virgilio ha utili strumenti su cui un programmatore possa interfacciarsi e creare piccoli script abbastanza interessanti, quindi un pò di fantasia e sani "like % %" come query nel DB.

    http://parole.virgilio.it/parole/

    Virgilio Parole.

    saluti


  • User Attivo

    Ottime precisazioni.
    Per questo ho detto "evidentemente ancora agli inizi".

    ciao,
    Lucas


  • User Attivo

    Interessanti link di cui non sarebbe male discutere:

    http://www.w3c.it/papers/RDF.pdf
    http://www.websemantico.org

    Lucas


  • User Attivo

    Altre discussioni sul futuro del Web Semantico e dei motori di ricerca semantici...

    Il primo è un articolo di Tim Berners-Lee, professore di Computer Science alla Sounthempton ESC e direttore/creatore del World Wide Web Consortion (il celebre W3C), in inglese.
    http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21

    Il secondo è una interessante definizione generale di Web Semantico con descrizione dell'RDF (Resource Description Framework), una particolare applicazione XML che rende standard la definizione di relazioni tra informazioni, utilizzando i principi della logica dei predicati e gli strumenti tipici del Web (tipo l'URI o l'URL) e dell'XML (namespace).
    http://it.wikipedia.org/wiki/Web_semantico

    Un interessante elenco di informazioni dettagliate da HTML.it http://pro.html.it/lista_articoli.asp/idcat_46/

    Infine un metamotore di recente creazione meritevole di attenzione. Il risultato di una ricerca su Kartoo.com non è una lista di pagine Web come solitamente avviene, bensì una mappa di siti uniti da linee che rappresentano graficamente i collegamenti semantici.
    http://www.kartoo.com/

    Lucas 😉


  • User

    Bello www.kartoo.com ...lo conoscevo!
    Molto interessante anche questo: www.touchgraph.com

    Mostra in maniera visuale la 'struttura del web' - costituita da nodi (i siti web) e da linee (i link) - come è visto da Google: a partire da un indirizzo internet immesso dall'utente, è infatti possibile analizzare le connessioni (i link) più o meno forti che il sito web in questione intrattiene con altri siti.

    :ciauz:


  • Super User

    Anche se non ho più il tempo per partecipare sui forum SEO come una volta, oggi ho seguito un REFERER dal mio sito e questa discussione ha attirato la mia attenzione.

    In particolare volevo dire la mia circa la natura semantica dell'algoritmo usato dalla ricerca di Libero.

    @Stealth said:

    Credo che libero con questo sito stia dando un contributo qualitativo all'utente, ma parlare di semantica è troppo.

    Stealth, quell'algoritmo è semantico sul serio. E pure bello tosto! 🙂

    Forse la ricerca di "pesca" non rende bene l'idea di quello che l'algoritmo può fare, ma la sua natura è fortemente semantica, in quanto si basa su una mappa di migliaia concetti (non parole o termini) correlati tra loro attraverso rapporti di vario genere.

    Ad esempio, approfondendo la ricerca "pesca" e cliccando su "pesca come Cattura degli animali", si accede ad un'ulteriore lista di suggerimenti che comprende "caccia alla balena", un suggerimento che non contiene per nulla la parola "pesca" e che è ottenibile solo lavorando sui concetti e non sui vocaboli.

    L'algoritmo utilizzato da Libero è stato fornito da Expert System, ed è probabilmente il più sofisticato esistente per la lingua italiana.

    Basti pensare che persino Google con l'acquisizione di Applied Semantics nell'aprile 2003, ottenendo tra le altre cose la tecnologia AdSense e l'algoritmo CIRCA, sul quale AdSense si basa, si ritrovò un algoritmo semantico ottimo, ma che non teneva conto di particolari (significativi) che l'algoritmo di Expert System invece gestisce.

    Se tra un po' di tempo uscisse fuori la notizia dell'acquisizione di Expert System da parte di un grosso motore di ricerca, la cosa non mi stupirebbe affatto.

    Ecco qui una white paper sulla tecnologia discussa. Non è tecnica, ma dovrebbe far intuire abbastanza bene le potenzialità del sistema e le differenze con i sistemi già esistenti (consiglio il paragone col CIRCA):

    http://www.expertsystem.it/documenti/pdf_tecnologia/white_paper_cogito.pdf

    Spero di aver fornito qualche spunto interessante.

    Temo che il poco tempo a disposizione renderà questo mio intervento solo una "comparsata". A rileggerci, prima o poi. 🙂

    Aggiunto: E complimenti a Giorgiotave per il bel forum!


  • User Attivo

    procederò alla lettura.


  • Community Manager

    Ciao Low,

    Grazie per l'articolo molto interessante.

    Ho letto alcune cose e prometto di rileggerlo bene ma quoto questa

    Un esempio fa immediatamente capire come la ricchezza di significati sia fonte di problemi
    d'interpretazione:
    (a) I due litiganti si sono scambiati calci e pugni.
    (b) Con la lente vide alcune piccole incisioni sul calcio della pistola.
    (c) Il campionato di calcio comincia la prima settimana di ottobre.
    (d) Il simbolo del calcio è Ca.
    Come si può vedere, una parola come ?calcio? ha diversi significati e tutti devono essere
    identificati in modo preciso per consentire una corretta elaborazione concettuale dei contenuti.
    All?interno di COGITO®, queste informazioni sono memorizzate in una serie di reti semantiche
    realizzate in modo specifico per l?elaborazione automatica dei testi: non semplici dizionari di
    termini, ma fitte reti di collegamenti e dati che consentono di rappresentare informazioni
    complesse, indispensabili per la disambiguazione. Grazie a queste informazioni, COGITO® sa che
    forme diverse (come ?disastro aereo? e ?sciagura aerea? oppure ?motorino? e ?ciclomotore?)
    rappresentano in realtà lo stesso concetto, un?operazione impossibile per i sistemi che si limitano
    ad agire sulle parole e non sui concetti.

    Siamo di fronte alla semantica pura, non ad un elenco di vocaboli.

    Aggiunto: grazie Low per i complimenti, fanno molto piacere


  • Super User

    Ciao Low.
    Vado a studiarmi il tutto con cura.

    Spero di aver fornito qualche spunto interessante.
    Ci puoi contare :vai:


  • User Attivo

    Ad esempio, approfondendo la ricerca "pesca" e cliccando su "pesca come Cattura degli animali", si accede ad un'ulteriore lista di suggerimenti che comprende "caccia alla balena", un suggerimento che non contiene per nulla la parola "pesca" e che è ottenibile solo lavorando sui concetti e non sui vocaboli.

    In effetti non avevo provato a proseguire la ricerca, mea culpa. Quello del web semantico è un concetto estremamente interessante ma non facile da capire perchè utilizza dei costrutti sia propri alla grammatica/matematica, sia alla "filosofia" (per fortuna qualche esame di filosofia dato in passato permette di non avere troppa paura di fronte a certi concetti un po' "astratti").
    Infatti le reti semantiche che si vogliono utilizzare per mettere in relazione gli argomenti non sono molto dissimili dalle reti neurali che permettono la formazione dei concetti (almeno per quanto se ne sà oggi del funzionamento del cervello).

    All'epoca della sua pubblicazione proposta da Tim Berners-Lee molti ne hanno parlato sulle ali dell'entusiasmo, nonostante ciò è piuttosto difficile trovare risorse e informazioni dettagliate, e non banali. A quanto pare però, dopo più di cinque anni (la Road Map di Berners-Lee è del '98 ), le applicazioni pratiche finalmente si stanno svliuppando (vedi appunto il motore di Libero, o anche il sistema dell'azienda americana suggerito in uno degli articoli su html.it che ho linkato sopra).

    Ho da tempo l'impressione che sia molto più difficile definire con parole e dare un applicazione pratica al concetto piuttosto che comprenderlo. Sto scrivendo un articolo sull'argomento proprio in questi giorni per una rivista a larga diffusione in cui la parte più complicata è proprio cercare di "farsi capire" dagli utenti medi: il documento che hai suggerito mi sarà certo di aiuto, sia per spiegare meglio il concetto, sia per portare un altro esempio pratico. Grazie mille dell'intervento e delle specifiche.

    Vedo che nell'articolo si usa l'esempio del "Calcio"... io ho utilizzato quello del "Golf" (che è sia uno sport, sia una maglia, sia il modello di una macchina), ma va bene anche quello di "Leopardi" (animale, scrittore), e innumerevoli altri...

    Posso chiederti anche un giudizio sul thesaurus di Godado e sul suo sistema di utilizzo?

    grazie,
    Lucas 😉

    ps: a quando il superamento del test di Turing? Siamo in ritardo di 5 anni... :fumato:


  • User Attivo

    Ma guarda un po' che bella cosetta:

    ho provato a cercare prima "[url=http://www.google.it/search?num=100&hl=it&c2coff=1&q=problem+submit+form+floppy+query&btnG=Cerca&meta=]problem submit form floppy query" e poi "[url=http://www.google.it/search?num=100&hl=it&c2coff=1&q=problem+submit+floppy+form+query&btnG=Cerca&meta=]problem submit floppy form query".

    Nel primo caso non mi viene dato alcun suggerimento di ricerca, nel secondo mi si dice "Forse cercavi: problem submit floppy from query".
    Direi che c'è una evidente analisi sulle triple (e cioè sulla presenza di soggetti, aggettivi, ecc. e sull'ordine delle parole)

    che ne dite?

    Lucas 😉

    ps: non venitemi a chiedere perchè stavo cercando quelle parole! :lol:


  • Super User

    Ciao Lucas e ciao a tutti!

    Questo è un 3D BELLISSIMO!!!

    Ho appena inserito quello che hai segnalato direttamente nel mio sito che ho creato per fare la mia tesi.

    Non so ancora perfettamente su cosa verterà ma si occuperà di web semantico.

    Per ora ho il compito di raccogliere piu informazioni possibili sull'uso da parte dei motori di ricerca di ontologie.

    Libero è un bel po avanti a parer mio...
    Spero tanto che questo 3D continui.

    Vi linko il sito della mia tesi: www.tesiweb.net

    Ciao e complimenti a tutti per questo 3D! 😄


  • User Attivo

    Ciao tuonorosso,

    se ti serve posso spedirti quell'articolo sull'argomento di cui parlavo due post sopra (devono ancora pubblicarlo perciò tienilo stretto 🙂 ), è piuttosto lungo e non molto complicato (è una panoramica), perciò sicuramente potrai trovare cose più tecniche qua e là, ma se ne hai bisogno di un pò di materiale per la tesi...

    dimmi pure, ciao,
    Lucas

    ps: sicuro che l'indirizzo del tuo sito sia giusto?


  • Super User

    certo certo..manda pure! 😉

    se hai msn aggiugnimi

    Ciao e grazie.

    PS: volendo potremmo tenere il mio sito come punto di raccolta di info se vuoi..


  • User Attivo

    Arrivo eh!
    Sono stato fuori genova fino a oggi.

    Ottima idea quella del "punto di ritrovo semantico"! 😉

    stasera o domattina ti mando l'articolo, ciauz,
    Lucas 🙂


  • Super User

    ottimo...e teniamo alto questo interessante 3D

    PS: non ci sono fino a domenica sera cmq 😉


  • User Attivo

    inviato all'email in firma!

    ciauz,
    Lucas 🙂


  • Super User

    ricevuto e risposto..

    GRAZIE GRAZIE