+ Rispondi alla Discussione
Pagina 1 di 2 12 UltimaUltima
Risultati da 1 a 50 di 55

L'intelligenza Artificiale come potrebbe migliorare i motori di ricerca?

Ultimo Messaggio di paocavo il:
  1. #1
    User
    Data Registrazione
    Apr 2007
    Località
    Roma
    Messaggi
    21

    L'intelligenza Artificiale come potrebbe migliorare i motori di ricerca?

    Sono nuovo in questo forum e mi complimento con tutti perche è davvero ottimo.
    Ho letto molti articoli in riguardo ai motori di ricerca, dai futuri motori semantici all'integrazione di sistemi che tengono conto anche di informazioni di tipo sociale. Ma per quanto riguarda l'intelligenza artificiale...come pensate che verrà usata nei MDR?

    grazie a tutti...

  2. #2
    User Attivo L'avatar di pierfrancesco99
    Data Registrazione
    Apr 2006
    Località
    Beri
    Messaggi
    1,196
    Bhe il primo esempio che mi viene in mente è un motore che basandosi su una cronologia dia determinati risultati

  3. #3
    Esperto L'avatar di Karapoto
    Data Registrazione
    Jun 2006
    Località
    Gallipoli
    Messaggi
    4,871
    Google già lo fa, in pratica col tempo ti "conosce" e modifica i risultati proprio in base al tipo di ricerche che effettui.

    Direi che è un bell'esempio di IA.

  4. #4
    User
    Data Registrazione
    Apr 2007
    Località
    Roma
    Messaggi
    21
    Citazione Originariamente Scritto da Karapoto Visualizza Messaggio
    Google già lo fa, in pratica col tempo ti "conosce" e modifica i risultati proprio in base al tipo di ricerche che effettui.

    Direi che è un bell'esempio di IA.

    Ciao e grazie per la risposta...

    quindi mi dici che google lo fa.... quindi se faccio una ricerca con il mio profilo personale deve essere diversa da quella che faccio senza che mi sono loggato sul mio profilo google? oppure nn è cosi?

  5. #5
    User
    Data Registrazione
    Apr 2007
    Località
    Roma
    Messaggi
    21
    Citazione Originariamente Scritto da pierfrancesco99 Visualizza Messaggio
    Bhe il primo esempio che mi viene in mente è un motore che basandosi su una cronologia dia determinati risultati
    quindi è come dice Karapoto ...che google già lo fa?

  6. #6
    User Attivo L'avatar di pierfrancesco99
    Data Registrazione
    Apr 2006
    Località
    Beri
    Messaggi
    1,196
    Karapoto ha ragione i parte si google gia lo fa ma non è affidabile al 100% un altro esempio sarebbe un motore che sempre in base a precedenti ricerche ti suggerisca la risposta

  7. #7
    User
    Data Registrazione
    Apr 2007
    Località
    Roma
    Messaggi
    21
    Citazione Originariamente Scritto da pierfrancesco99 Visualizza Messaggio
    Karapoto ha ragione i parte si google gia lo fa ma non è affidabile al 100% un altro esempio sarebbe un motore che sempre in base a precedenti ricerche ti suggerisca la risposta
    Giusto.. Google è troppo legata al suo PR ed altri suoi parametri...quindi la SERP che viene fuori sarà sempre troppo influenzata ...

    Per quanto riguarda la tua idea secondo me è giusta...pero se un utente che non ha cronologia usa per la prima volta il motore da quali dati riceve la prima SERP?

  8. #8
    User Attivo L'avatar di pierfrancesco99
    Data Registrazione
    Apr 2006
    Località
    Beri
    Messaggi
    1,196
    In quel caso direi una serp "normale" poi dopo 2-3 ricerche si iniziera a creare una cronologia

  9. #9
    User
    Data Registrazione
    Apr 2007
    Località
    Roma
    Messaggi
    21
    Citazione Originariamente Scritto da pierfrancesco99 Visualizza Messaggio
    In quel caso direi una serp "normale" poi dopo 2-3 ricerche si iniziera a creare una cronologia

    ma una SERP normale si dovrebbe basare sempre su una indicizzazione che usa la LP e altri metodi che ha trovato Google e altri...

    un motore innovativo dovrebbe indicizzare sin dall'inizio senza usare la LP per esempio con un Ranking Semantico...che ne dici?

  10. #10
    User Attivo L'avatar di pierfrancesco99
    Data Registrazione
    Apr 2006
    Località
    Beri
    Messaggi
    1,196
    Giusto...una cosa è certa chi inventerà sto metodo fara un bel po di soldi

  11. #11
    User
    Data Registrazione
    Apr 2007
    Località
    Roma
    Messaggi
    21
    Citazione Originariamente Scritto da pierfrancesco99 Visualizza Messaggio
    Giusto...una cosa è certa chi inventerà sto metodo fara un bel po di soldi

    penso proprio di si...cmq è ancora molto lontana la cosa... poi parlare di semantica non vuol dire AI ...oppure mi sbaglio? cosa ne pensi?

  12. #12
    Utente Premium
    Data Registrazione
    Jan 2007
    Località
    Roma
    Messaggi
    159
    Segui Nemesis_RM su Twitter
    Ma per IA cosa intendete?
    Fino a dove si spinge l'intelligenza artificiale?
    Esiste già?
    Io non so niente di sta robba..
    Nemesis Design: Realizzazione siti web - Web Design

  13. #13
    Moderatore L'avatar di paocavo
    Data Registrazione
    Mar 2006
    Località
    Lecce, Italy
    Messaggi
    1,012
    Aggiungi paocavo su Facebook Aggiungi paocavo su Linkedin
    Per cominiciare:

    http://it.wikibooks.org/wiki/Intelligenza_artificiale

    Per approfondire:

    Intelligenza artificiale - di Nils J. Nilsson


    PS: Il trattamento automatico della lingua e l'analisi semantica sono "solo" branche dell'Intelligenza Artificiale (IA).

    Segnalo anche questa Tesi (in Italiano)


  14. #14
    Esperto L'avatar di FuSioNmAn
    Data Registrazione
    Jan 2007
    Località
    Salerno
    Messaggi
    495
    Aggiungo che con la sola IA non puoi determinare la popolarità di un sito e quindi la sua affidabilità.
    E' una cosa che va sempre a braccetto con altre...da sola non basta comunque.

  15. #15
    User
    Data Registrazione
    Apr 2007
    Località
    Roma
    Messaggi
    21
    Citazione Originariamente Scritto da paocavo Visualizza Messaggio
    Per cominiciare:

    http://it.wikibooks.org/wiki/Intelligenza_artificiale

    Per approfondire:

    Intelligenza artificiale - di Nils J. Nilsson


    PS: Il trattamento automatico della lingua e l'analisi semantica sono "solo" branche dell'Intelligenza Artificiale (IA).

    Segnalo anche questa Tesi (in Italiano)

    Ciao Paolo,

    ho letto molti tuoi post su questo forum e ti volevo fare i complimenti per la qualità delle risposte e la tua simpatia...
    detto questo... volevo sapere ...ma il programma che hai fatto tu (Clusterizer: classificazione automatica on-line di keywords e stringhe di testo) non è una sorta di Intelligenza Artificiale, cioè segue un comportamento simile a quello che farebbe un essere umano posto davanti a quel problema...

    cosa ne dici?


    ciao

  16. #16
    User
    Data Registrazione
    Apr 2007
    Località
    Roma
    Messaggi
    21
    Citazione Originariamente Scritto da FuSioNmAn Visualizza Messaggio
    Aggiungo che con la sola IA non puoi determinare la popolarità di un sito e quindi la sua affidabilità.
    E' una cosa che va sempre a braccetto con altre...da sola non basta comunque.

    be si...anche io la penso cosi...un sistema completamente artificiale sarebbe utile per degli esseri artificiali...e non umani.
    Pero è anche vero che potrebbe dare una grossa mano per eliminare il web spam che è una cosa odiosa!
    Inoltre potrebbe essere usato per migliorare la qualità della SERP...

  17. #17
    Moderatore L'avatar di paocavo
    Data Registrazione
    Mar 2006
    Località
    Lecce, Italy
    Messaggi
    1,012
    Aggiungi paocavo su Facebook Aggiungi paocavo su Linkedin
    Citazione Originariamente Scritto da Andrea77 Visualizza Messaggio
    Ciao Paolo,

    ho letto molti tuoi post su questo forum e ti volevo fare i complimenti per la qualità delle risposte e la tua simpatia...
    detto questo... volevo sapere ...ma il programma che hai fatto tu (Clusterizer: classificazione automatica on-line di keywords e stringhe di testo) non è una sorta di Intelligenza Artificiale, cioè segue un comportamento simile a quello che farebbe un essere umano posto davanti a quel problema...

    cosa ne dici?


    ciao
    Ciao Andrea,
    Clusterizer è un'applicazione web che implementa un algoritmo (clustering k-means) utilizzato in ambito IA (ma non solo...).
    Clusterizer classifica un insieme di keywords e/o keyphrases in categorie autodeterminate sulla base delle loro "distanza" in uno spazio vettoriale n-dimensionale. Tutte le frasi che sono vicine fra loro costituiscono un cluster (cioè una categoria, un gruppo ben definito).
    Quando sono vicine due o più frasi? Inizialmente quando condividono qualche termine in comune, successivamente (iterativamente parlando) quando condividono la "semantica".
    In questo senso "è una sorta di Intelligenza artificiale" ma l'IA non è solo questo ma molto e molto altro ancora...
    L'algoritmo di clustering k-means non è il solo atto a questo scopo, ne esistono altri che, per esempio, analizzano la probabilità che una data keywords appartenga ad un cluster. Questi sono più raffinati in quanto è possibile che una stessa frase appartenga a più cluster con probabilità differenti. con K-means invece ciascuna frase può appartenere ad un solo cluster.

    PS: Grazie per i complimenti

  18. #18
    User
    Data Registrazione
    Apr 2007
    Località
    Roma
    Messaggi
    21
    Citazione Originariamente Scritto da paocavo Visualizza Messaggio
    Ciao Andrea,
    Clusterizer è un'applicazione web che implementa un algoritmo (clustering k-means) utilizzato in ambito IA (ma non solo...).
    Clusterizer classifica un insieme di keywords e/o keyphrases in categorie autodeterminate sulla base delle loro "distanza" in uno spazio vettoriale n-dimensionale. Tutte le frasi che sono vicine fra loro costituiscono un cluster (cioè una categoria, un gruppo ben definito).
    Quando sono vicine due o più frasi? Inizialmente quando condividono qualche termine in comune, successivamente (iterativamente parlando) quando condividono la "semantica".
    In questo senso "è una sorta di Intelligenza artificiale" ma l'IA non è solo questo ma molto e molto altro ancora...
    L'algoritmo di clustering k-means non è il solo atto a questo scopo, ne esistono altri che, per esempio, analizzano la probabilità che una data keywords appartenga ad un cluster. Questi sono più raffinati in quanto è possibile che una stessa frase appartenga a più cluster con probabilità differenti. con K-means invece ciascuna frase può appartenere ad un solo cluster.

    PS: Grazie per i complimenti
    ciao Paolo scusa per il ritardo con cui rispondo,

    allora quando dici:
    In questo senso "è una sorta di Intelligenza artificiale" ma l'IA non è solo questo ma molto e molto altro ancora...

    il molto e molto altro ancora cosa sarebbe? (ovviamente qualche esempio )
    inoltre... i MDR come Google e Yahoo e altri basano sulla popolarità di un sito o pagina, ma la popolarità di un sito è sempre sinonimo di qualità?
    non potrebbe essere che è stato progettato meglio a livello di web marketing e toglie spazio a chi invece in condizioni normali sarebbe nei primi 10 risultati e quindi visibile ai navigatori (in quanto dal 10 in poi praticamente è come se non esistesse)?

    tu cosa ne pensi?

    Ciao

  19. #19
    Moderatore L'avatar di paocavo
    Data Registrazione
    Mar 2006
    Località
    Lecce, Italy
    Messaggi
    1,012
    Aggiungi paocavo su Facebook Aggiungi paocavo su Linkedin
    Citazione Originariamente Scritto da Andrea77 Visualizza Messaggio
    ciao Paolo scusa per il ritardo con cui rispondo,

    allora quando dici:
    In questo senso "è una sorta di Intelligenza artificiale" ma l'IA non è solo questo ma molto e molto altro ancora...
    il molto e molto altro ancora cosa sarebbe? (ovviamente qualche esempio )


    L’IA è una disciplina che studia i fondamenti teorici, le metodologie e le tecniche che permettono di concepire, progettare, realizzare, sperimentare ed utilizzare sistemi artificiali sia simulati via software che implementati in hardware con gli obiettivi di ottenere prestazioni ritenute caratteristiche dell’intelligenza e di fornire modelli computazionali di processi cognitivi.
    Fonte: http://ia.di.uniba.it/

    Applicazioni principali
    Attualmente questi sono i principali algoritmi dell'intelligenza artificiale:

    Rappresentazione della conoscenza
    Apprendimento automatico (Machine Learning)
    Apprendimento non supervisionato
    Clustering
    Regole di associazione
    Apprendimento supervisionato
    Albero di decisione
    Regole di decisione
    Sistemi Esperti
    Apprendimento per rinforzo
    Reti neurali
    Algoritmi genetici o evolutivi
    Sistemi a classificatori
    Programmazione Logica Induttiva (ILP)
    Visual retrieval
    Visione artificiale
    Problema di soddisfacimento di vincoli

    Fonte: http://it.wikipedia.org/wiki/Intelli...oni_principali

    Inoltre... i MDR come Google e Yahoo e altri basano sulla popolarità di un sito o pagina, ma la popolarità di un sito è sempre sinonimo di qualità?
    La popolarità di un sito è solo uno di tanti e tanti fattori considerati dai MDR.
    Anche se è uno di quelli preponderanti (perche un sito autorevole dovrebbe linkare un sito "fasullo"?)

    non potrebbe essere che è stato progettato meglio a livello di web marketing e toglie spazio a chi invece in condizioni normali sarebbe nei primi 10 risultati e quindi visibile ai navigatori (in quanto dal 10 in poi praticamente è come se non esistesse)?
    tu cosa ne pensi?
    Bella domanda!
    Per rispondere si potrebbe scrivere un libro (e forse tu lo stai già facendo... no? tesi? )
    Adesso vado a cenare, a presto...


  20. #20
    User
    Data Registrazione
    Sep 2005
    Messaggi
    451
    I motori di ricerca non hanno bisogno dell'intelligenza artificiale. Il lavoro di un motore è quello di presentare documenti pertinenti ad una query, ma il grandissimo problema è che l'utente digita query troppo vaghe come per esempio "ristoranti". E il motore capisce che la query è troppo vaga, quindi è costretto ad utilizzare espansione delle query ed altri sistemi per presentare risultati più pertinenti.

    Analizzando le ricerche di un singolo utente può verificare meglio i gusti e quindi presentare documenti più pertinenti. Per esempio non è difficile capire di dov'è un utente in base alle ricerche che fa, pertanto se io digito la query "ristoranti" il motore di ricerca del futuro espanderà la query all'area geografica di mio interesse e allora mi farà vedere i risultati di: "ristoranti roma".

    Questo è un esempio stupido, ma spero sia chiaro per individuare il reale problema a cui devono trovare soluzione i motori.

  21. #21
    User
    Data Registrazione
    Sep 2005
    Messaggi
    451
    "non potrebbe essere che è stato progettato meglio a livello di web marketing e toglie spazio a chi invece in condizioni normali sarebbe nei primi 10 risultati e quindi visibile ai navigatori (in quanto dal 10 in poi praticamente è come se non esistesse)?"

    Il posizionamento è una conseguenza di una strategia, non un fine. Pertanto è ovvio che un motore premia chi studia un sito dal punto di vista di una strategia più ampia, uno spammer farebbe mai web marketing ? No, prende 1000 siti mette su del testo e spera in dio di non essere bannato.

    In termini pratici prendi una query come mutui, difficilmente un motore premierebbe il sito di peppino sui mutui, più facile che premi chi ci ha studiato per molteplici motivi: primo di tutto perchè è più probabile che un sito studiato dal punto di vista del marketing rispetti i desideri dell'utente, leggi risultati pertinenti, leggi qualità migliori nei risultati di ricerca, leggi più gente userà il mio motore perchè presenta dei buoni risultati.

  22. #22
    Utente Premium
    Data Registrazione
    Jan 2007
    Località
    Roma
    Messaggi
    159
    Segui Nemesis_RM su Twitter
    Ma allora i motori di ricerca attualmente fanno uso di sistemi dotati di Intelligenza Artificiale, sì o no?
    Nemesis Design: Realizzazione siti web - Web Design

  23. #23
    User
    Data Registrazione
    Sep 2005
    Messaggi
    451
    Nessuno può rispondere a questa domanda, ma a mio parere no.

  24. #24
    Moderatore L'avatar di paocavo
    Data Registrazione
    Mar 2006
    Località
    Lecce, Italy
    Messaggi
    1,012
    Aggiungi paocavo su Facebook Aggiungi paocavo su Linkedin
    ...ehm, in realtà uno degli autori del libro più importante sull'argomento "Intelligenza Artificiale: un approccio moderno" (2 volumi) è Peter Norvig che, guarda caso: is currently the Director of Research (formerly Director of Search Quality) at Google Inc


  25. #25
    User
    Data Registrazione
    Sep 2005
    Messaggi
    451
    Rimango del mio parere :P

  26. #26
    Esperto L'avatar di agoago
    Data Registrazione
    Apr 2005
    Messaggi
    481
    uMoR quello che dici, l'esempio (e le considerazioni) del ristorante o dei mutui e' giustissimo, ma non e' in contrasto con l'affermazione che i motori usino intelligenza artificiale.

    Anzi, a maggior ragione, per risolvere i problemi che citi dovrammo migliorare-implementare ulteriormente algoritmi "estermi", magari legati piu' agli utenti e meno al lavoro dei wm.

    Ma girala come vuoi sempre di intelligenza artificiale (debole) si tratta.

    ---

    La cosa simpatica e' l'idea che normalmente ha la "gente comune" dell'intelligenza artificiale. La maggior parte dei non addetti ai lavori crede che l'intelligenza artificiale in informatica sia cosa da pochi ed espertissimi, cosa degna di reverenziale rispetto sia per la materia che per chi la tratta.

    Quando poi gli spieghi che per fare un buon sito totalmente artificiale ci vuole tanta ricerca ed intelligenza artificiale debole come quella necessaria a creare da 0 un motorino di ricerca discreto, ecco che allora si ricredono.

    Si ricredono e vedono l'ai per quello che realmente e', un insieme piu' o meno semplice di regole che interagendo tra di loro simulano-riproducono schemi decisonali funzionali all'uomo.

    Tutto qui, a ben vedere niente di cosi' complicato.
    Se metto sulla mia auto un rilevatore di distanza e gli dico di azionarmi l'apri cancello quando sono distante meno di 5 metri e vado a meno di 20 all'ora (ma solo se lo trova chiuso), ecco che parliamo di intelligenza artificiale.

    Sara' sicuramente artificiale, ma in questo caso di intelligente ci vedo poco...

    ----

    Intelligente invece e' un sistema di estrapolazione automatizzato delle keyphrase, come il programma Clusterizer di Paolo.
    Tuttavia i programmi intelligenti non servono a nulla se non si e' poi cosi' intelligenti da usarli quotidianamente.

    Sistemi come Clusterizer o Kea (che io ora uso per sbrigarmi con un modulo mio basato sull'analisi circa di un milione di documenti) sono eccezionali per indirizzare un wm con che keylink lincare i propri documenti o le pagine altrui.
    Oppure per mettere le key salienti di una pagina nel titolo della stessa o nella sua description. Per non parlare dei tag di un blog etc...

    Un semplice esempio.

    Sappiamo benissimo che i motori "aggiungono-attribuiscono" ad un documento le key usate nei link per lincarlo.

    E' una tecnica per i motori cosi' normale e "di peso" che a volte e' possibile travare in cima alle serp addirittura dei documenti che non contengono la keyword usata per la query di quella serp, e questo solo perche' quella keyword e' assegnata al documento dalle keylink.

    Ora ipotizziamo che un wm voglia fuorviare i motori per danneggiare un concorrente, e decida di lincare una pagina del concorrente con dei link che contengono come keylink dei termini incongruenti-distanti-assurdi rispetto al contenuto della pagina concorrente lincata.

    Il wm di cui sopra, credendosi furbo ragiona: se io linco la pagina concorrente che parla di "mutui" con la key "bollito" il motore attribuira' un po' di bollito anche alla pagina dei mutui e di certo questo non l'aiutera'.

    Questo forse valeva qualche anno fa, prima che i motori per "difendersi" da queste nefandezze implementarono un po' di quell'intelligenza artificiale usata nei sistemi di "keyphrase indexing" (come quello di Paolo) per stabilire con buon margine che la pagina lincata con bollito invece parla di mutui.

    Conseguenza?

    Di conseguenza il wm furbo oggi viene penalizzato pesantemente.
    Il motore infatti ragiona: se questo wm non e' capace neanche di lincare correttamente un altro documento, come posso ritenere (io motore) che quel wm sia ingrado di produrre documenti suoi degni di nota-decenti?

    --

    Veniamo al dunque.

    Quante volte oggi un wm linca una pagina sua o di un collega senza valutare con attenzione la keylink usata?

    E come essere aiutati-indirizzati affinche' una keylink sia veramente valida?

    Appunto con sistemi-tecniche di intelligenza artificiale.

    Pertanto o li usi quotidinamente o ti leggi ogni volta tutto il documento e poi ci ragioni con attenzione.

    Se per sbrigarti usi-copi un pezzo del titolo od il nome della pagina rischi piccole penalizzazioni, il motore penalizza chi pretende di consigliare un utente dove andare senza neanche sbattersi a riassumerne di suo il contenuto e per sbrigarsi copia-usa ovvieta'.

    Per questo ed altri motivi domandiamoci non solo se i motori utlizzano l'intelligenza artificiale, ma se l'utilizzano anche i wm.

  27. #27
    Utente Premium
    Data Registrazione
    Jan 2007
    Località
    Roma
    Messaggi
    159
    Segui Nemesis_RM su Twitter
    Molto interessante, fino a poco tempo fa non sapevo nulla di questo argomento.

    Posso sapere cosa sono più precisamente questi clusterizer, a cosa servono e dove si trovano?
    Nemesis Design: Realizzazione siti web - Web Design

  28. #28
    Moderatore L'avatar di paocavo
    Data Registrazione
    Mar 2006
    Località
    Lecce, Italy
    Messaggi
    1,012
    Aggiungi paocavo su Facebook Aggiungi paocavo su Linkedin
    Citazione Originariamente Scritto da agoago Visualizza Messaggio
    ...
    Intelligente invece e' un sistema di estrapolazione automatizzato delle keyphrase, come il programma Clustezer di Paolo.
    Clustezer:
    E' una applicazione web che permette la classificazione automatica di keywords e keyprhases in categorie auto-determinate</I>. Utilizza l'algoritmo di clustering K-means ed, in termini di IA, è un esempio di apprendimento non-supervisionato.
    Disponibile, previa registrazione gratuita, su www.nelsenso.net

    Se per sbrigarti usi-copi un pezzo del titolo od il nome della pagina rischi piccole penalizzazioni, il motore penalizza chi pretende di consigliare un utente dove andare senza neanche sbattersi a riassumerne di suo il contenuto e per sbrigarsi copia-usa ovvieta'.
    Per questo ed altri motivi domandiamoci non solo se i motori utlizzano l'intelligenza artificiale, ma se l'utilizzano anche i wm.
    Summazer:
    Summazer riassume automaticamente un testo estrapolando le frasi con più elevata rilevanza semantica. Si basa sul principio di reciproco rinforzo fra termini e frasi. Anche questo tool è disponibile sul suddetto sito.

    Grazie Ago
    Ultima modifica di paocavo; 11-11-12 alle 09:19 Motivo: Aggiornati URL di NelSenso

  29. #29
    Utente Premium
    Data Registrazione
    Jan 2007
    Località
    Roma
    Messaggi
    159
    Segui Nemesis_RM su Twitter
    Grazie, ce ne sono anche altri da far girare in locale o da scaricare?
    Nemesis Design: Realizzazione siti web - Web Design

  30. #30
    User
    Data Registrazione
    Sep 2005
    Messaggi
    451
    "Anzi, a maggior ragione, per risolvere i problemi che citi dovrammo migliorare-implementare ulteriormente algoritmi "estermi", magari legati piu' agli utenti e meno al lavoro dei wm."

    Per me è statistica, non intelligenza artificiale!

  31. #31
    Moderatore L'avatar di paocavo
    Data Registrazione
    Mar 2006
    Località
    Lecce, Italy
    Messaggi
    1,012
    Aggiungi paocavo su Facebook Aggiungi paocavo su Linkedin
    Citazione Originariamente Scritto da agoago
    Sistemi come Clusterizer o Kea...
    Ciao Ago ,
    puoi fornirci maggiori info su Kea?



    [edit]
    ..ops, eccolo (non lo conoscevo). Thanks
    [/edit]

  32. #32
    Esperto L'avatar di agoago
    Data Registrazione
    Apr 2005
    Messaggi
    481
    Kea e' un progetto pubblico e libero (come i sorgenti) dell'universita' di Waikato. Kea e Weka sono opera del dott. F. Eibe con l'aiuto per la parte di indicizzazione delle keyphrase di una sua studentessa che ha ricevuto la borsa di studio da... Google

    http://www.nzdl.org/Kea/

    Ho integrato Kea in un mio progetto piu' ampio (del quale parlero' in modo approfondito questa estate), ho creato un mio modello basato sull'analisi dei testi di tutta Wikipedia, e lo uso per decidere con che keylink lincare le pagine interne.

    Ho anche ampliato l'elenco delle stopkey originarie di Kea, ma premetto che su windows ho seri problemi di memoria in quanto java non mi vede-usa oltre 1,5 giga di ram.

    Purtroppo il problema dei limiti "hardware", il problema dei tempi di lettura ed analisi dei testi, sono il vero dramma in questo genere di studi-lavori.

    ---

    Faccio un esempio banale.
    Se per analizzare-valutare 1 mega di testo ci si impiegasse 1 secondo, per un testo da 10 mega ci potrebbe volere 1 minuto, 100 mega un ora... immaginiamo processare un tera di materiale!

    Per capirci, si pensi solo alle catene di Marcov.
    Un conto se devo scegliere per procedere tra 5 parole, un conto tra 60.000 potabili.
    Prendo a caso o analizzo quale siano le migliori tra quelle 60.000?
    Ma le migliori sono quelle che hanno maggior frequenza (rispetto al testo precedente) o quelle che hanno un senso logico rispetto al pezzo di testo?

    Se avessi:

    casa rossa

    potrei scegliere poi:

    bandiera

    questo se mi basassi solo su rossa come parola da analizzare per decidere come proseguire, ma se lavorassi su "casa rossa" invece che solo su "rossa" non sceglierei bandiera.

    Ma anche 2 parole possono non bastare, allora diciamo che lavoriamo su 4.
    Ecco che allora prendo:

    la bella casa rossa

    e vedo cosa c'e' normalmente dopo, potrei dover scegliere tra:

    affittasi
    ,
    e
    nel
    bruciata
    etc

    ma siamo da capo.

    Anche se nel 90% dei casi "affittasi" seguisse "la bella casa rossa" non avrebbe senso privilegiarla, perche' se la frase fosse lunga potrei preferire la "," se la frase parla di pompieri allora seglierei "bruciata" e via discorrendo.

    Per capire di cosa parla la frase dovro' tenere conto del significato di ogni parola, dei sinonimi, dovro' contare aggettivi, congiunzioni, nomi (e quanto altro) per sapere se dopo "la bella casa rossa" sia meglio mettere un aggettivo, un verbo, un articolo o magari chiudere la frase con un punto.
    Se un verbo prima era al passato dovro' privilegiare quel tempo...

    Diventa dura frase per frase, immaginiamoci per un documento nel suo complesso.

    Per questi motivi purtoppo, anche i migliori programmi disponibili sul web, spesso (praticamente sempre) possono essere utilizzati o a fini di studio o per analisi magari profondissime ma su piccole porzioni di testo.

    In caso di grossi volumi ecco che bisogna spezzare i corpus, dividerli in 100 modi, per grammatica, per alfabeto, per peso, per logica, per tema, per sinonimi, per lunghezza frasi, per numero parole, per lingue, per unicode, per anzianita', (che me ne faccio a fini pratici di un corpus basato sulla Bibbia?) etc etc.

    E cosi' i giga diventono tera...

    Poi riprovi il tutto nuovamente ma ottieni le solite risposte: out of memory, out of patience, out of your time life limit... da piangere.

  33. #33
    Moderatore L'avatar di paocavo
    Data Registrazione
    Mar 2006
    Località
    Lecce, Italy
    Messaggi
    1,012
    Aggiungi paocavo su Facebook Aggiungi paocavo su Linkedin
    Citazione Originariamente Scritto da agoago Visualizza Messaggio

    In caso di grossi volumi ecco che bisogna spezzare i corpus, dividerli in 100 modi, per grammatica, per alfabeto, per peso, per logica, per tema, per sinonimi, per lunghezza frasi, per numero parole, per lingue, per unicode, per anzianita', (che me ne faccio a fini pratici di un corpus basato sulla Bibbia?) etc etc.

    E cosi' i giga diventono tera...

    Poi riprovi il tutto nuovamente ma ottieni le solite risposte: out of memory, out of patience, out of your time life limit... da piangere.
    E già... questo è un tipico problema in cui si dovrebbero utilizzare applicazioni distribuite in ambito parallelo o "parallel computing"


  34. #34
    User
    Data Registrazione
    Apr 2007
    Località
    Roma
    Messaggi
    21
    Citazione Originariamente Scritto da paocavo Visualizza Messaggio
    [/color][/i]

    L’IA è una disciplina che studia i fondamenti teorici, le metodologie e le tecniche che permettono di concepire, progettare, realizzare, sperimentare ed utilizzare sistemi artificiali sia simulati via software che implementati in hardware con gli obiettivi di ottenere prestazioni ritenute caratteristiche dell’intelligenza e di fornire modelli computazionali di processi cognitivi.
    Fonte: http://ia.di.uniba.it/

    Applicazioni principali
    Attualmente questi sono i principali algoritmi dell'intelligenza artificiale:

    Rappresentazione della conoscenza
    Apprendimento automatico (Machine Learning)
    Apprendimento non supervisionato
    Clustering
    Regole di associazione
    Apprendimento supervisionato
    Albero di decisione
    Regole di decisione
    Sistemi Esperti
    Apprendimento per rinforzo
    Reti neurali
    Algoritmi genetici o evolutivi
    Sistemi a classificatori
    Programmazione Logica Induttiva (ILP)
    Visual retrieval
    Visione artificiale
    Problema di soddisfacimento di vincoli

    Fonte: http://it.wikipedia.org/wiki/Intelli...oni_principali

    [i][color=#4169e1]

    La popolarità di un sito è solo uno di tanti e tanti fattori considerati dai MDR.
    Anche se è uno di quelli preponderanti (perche un sito autorevole dovrebbe linkare un sito "fasullo"?)



    Bella domanda!
    Per rispondere si potrebbe scrivere un libro (e forse tu lo stai già facendo... no? tesi? )
    Adesso vado a cenare, a presto...

    Ciao Paolo, scusa il ritardo ma non avevo visto la tua risposta...
    Non sto scrivendo una tesi perche sono iscritto a Fisica (anche se fuori corso) comunque è un argomento di grande interesse e sto creando una piccola azienda che vorrebbe creare un suo "motore personale" rivolto sopratutto alle aziende. Ho lavorato nel campo del web marketing per 1 anno e ho verificato che l'unica cosa che funziona bene come ritorno degli investimenti è proprio la pubblicità sui motori di ricerca, sia come vendite che come immagine del marchio. Quindi ho pensato di creare un motore personale che includa algoritmi di AI per fare meglio il proprio lavoro. L'AI(forse per i Film) è vista come qualcosa di irraggiungibile...però il tuo algoritmo è già una prova che qualcosa si può fare (e non è poco). Comunque sono solo in fase di partenza e la strada sarà molto lunga e difficile e non è detto che il risultato finale sia accettabile, però fino a quando uno non prova non si puo dire.
    Devo dire che la comunità di Giorgio Tave è davvero eccezionale, non vi conoscevo prima di trovarvi tramite internet, e non pensavo che in Italia ci fosse un livello di competenza cosi buono...complimenti a tutti

  35. #35
    Esperto L'avatar di agoago
    Data Registrazione
    Apr 2005
    Messaggi
    481
    Paocavo scrive:

    "E già... questo è un tipico problema in cui si dovrebbero utilizzare applicazioni
    distribuite in ambito parallelo o "parallel computing""

    Ho seguito il link e letto un po' la documentazione.
    L'unica parola (di tutto) che ho capito' e' "parallelo".
    Credo sinceramente che sia oltre le mie capacita'.

    Ma almeno adesso so perche' riscontro questi limiti!

  36. #36
    mix
    mix è offline
    Banned L'avatar di mix
    Data Registrazione
    May 2006
    Località
    puglia/salento/brindisi/mesagne
    Messaggi
    1,040
    agoago

    il problema delle tue risorse lo risolvi appena ( spero che il suo avvento non tardi ) il sistema globus farà il suo ingresso sulla rete.

    La potenza di calcolo che questo sistema offre è illimitata.

    In parole povere hai presente come funziona il p2p?

    Bene, li si sharano file ( di tutti i tipi mp3 avi rar ecc. ) con globus si sharano le risorse di sistema.

    Siamo ancora agli albori, e ti posso dire che questo tipo di ricerca va lenta non tanto per la mancanza di menti geniali che la sviluppino, ma per i troppi interessi ( questo è un altro capitolo ).

    Dobbiamo pazientare, con un amico abbiamo sviluppato un software molto simile al tuo ma con scopo differente, ci limita proprio la potenza di calcolo che abbiamo a disposizione.

    Poi a lavoro ho incontrato un ingegnere 24 enne che stava preparando la sua tesi su
    globus e da li l' illuminazione, tutto il mio entusiasmo fu frenato quando mi disse che per ora
    globus funge solo in lan e malamente, e che le ricerche vanno a rilento.

    E che lui insoddisfatto dal sistema ( no globus, ma dalla gente che lo circondava ) aveva lasciato il progetto che non li dava più stimoli.

  37. #37
    User
    Data Registrazione
    Sep 2005
    Messaggi
    451
    Ago prima di pensare ai cluster proverei a riscrivere tutto il software in qualche linguaggio tipo c e strutturarlo per utilizzare basi di dati studiate ad-hoc (discorso già fatto 1000 volte)..

    Spero che non ti basi su MySql per gestire tutti quei dati

  38. #38
    mix
    mix è offline
    Banned L'avatar di mix
    Data Registrazione
    May 2006
    Località
    puglia/salento/brindisi/mesagne
    Messaggi
    1,040
    uMoR il mio software scritto in c# ha piegato già 4 pc

  39. #39
    User
    Data Registrazione
    Sep 2005
    Messaggi
    451
    Eh ma almeno il software sfrutta appieno la potenza di calcolo, se scrivi un programma in visual basic hai voglia.. :P

  40. #40
    Moderatore L'avatar di paocavo
    Data Registrazione
    Mar 2006
    Località
    Lecce, Italy
    Messaggi
    1,012
    Aggiungi paocavo su Facebook Aggiungi paocavo su Linkedin
    siamo un tantino OT...

  41. #41
    User
    Data Registrazione
    Mar 2006
    Messaggi
    131
    A proposito dell'interessante argomento di discussione, segnalo a tutti questo simpatico seminario in cui mi sono imbattuto...

    http://video.google.com/videoplay?do...88615049492068

    carino, vero? :-)
    Non ho idee regalo, ma ho il pacco.

  42. #42
    Esperto L'avatar di agoago
    Data Registrazione
    Apr 2005
    Messaggi
    481
    Citazione Originariamente Scritto da rocco_bruno Visualizza Messaggio
    A proposito dell'interessante argomento di discussione, segnalo a tutti questo simpatico seminario in cui mi sono imbattuto...

    http://video.google.com/videoplay?do...88615049492068

    carino, vero? :-)
    Grazie Rocco Bruno, e' la cosa piu' interessante intelligente ed utile che, per merito della tua segnalazione, ho avuto la fortuna di leggere-vedere.

    Purtroppo la qualita' del video in alcuni casi non mi permette di leggere bene i diagrammi mostrati nella conferenza, se qualcuno dei colleghi trovasse lo stesso video in qualita' migliore per favore lo segnali.

    Comunque da vedere assolutamente, soprattutto per chi frequenta abitualmente questa sezione del forum, si parla di linguaggio naturale, di ontologia formale... etc fantastico!

  43. #43
    Moderatore L'avatar di paocavo
    Data Registrazione
    Mar 2006
    Località
    Lecce, Italy
    Messaggi
    1,012
    Aggiungi paocavo su Facebook Aggiungi paocavo su Linkedin
    Molto, molto interessante!!

    Grazie rocco_bruno!!

  44. #44
    Esperto L'avatar di agoago
    Data Registrazione
    Apr 2005
    Messaggi
    481
    Ho installato il programma che e' alla base del video in discussione:

    http://www.opencyc.org/

    Funziona bene, peccato ci siano poche relazioni "preimpostate", ma del resto il programma deve servire nell'intento per essere adattato alle necessita' personali dei vari utilizzatori, e non per fornire un prodotto pronto all'uso per tutti.

    Di certo sara' un bel salto di qualita', una grande rivoluzione.

    In poche parole oggi se cerco:

    Cosa contiene la scatola

    mi vengono presentate le pagine con dentro le parole scatola, cosa, contiene o contenere ecc ecc

    In futuro invece potrei avere come risultati delle pagine che parlano di regali, di prodotti e cosi' via, pagine magari che non contengono (o sono lincate) con le parole scatola, cosa, contiene o contenere etc.

    Se questo nuovo sistema fosse implementato in modo "pesante" di fatto stravolgerebbe molte serp, premiando probabilmente pagine ricche di contenuti, di "risposte", piuttosto che quelle pagine che ora sono premiate perche' propongono al loro interno prevalentemente i termini delle query, anzi a volte solo quelle...

    ----------

    Di certo, se e quando avverra' questa innovazione, potrebbe rivelarsi un problema per alcuni seo.

    Oggi molti seo lavorano per societa' di posizionamento o per clienti che in genere chiedono-pretendono di vedere migliorare le proprie posizioni per un target di key ben precise.

    Se il cliente chiede: cane pazzo, il seo inizia a controllare se e come e' scritto "cane pazzo" all'interno delle pagine del cliente.

    E' un lavoro per alcuni versi complicato, ma per altri semplice.

    Se un domani i seo scoprissero che per spingere cani pazzi doveno-dovrebbero scrivere contenuti su cosa mangiano i cani (impazziscono per il cibo?) sui metodi di allevamento (impazziscono perche' trattati male?) o sui comportamenti strani dei principali animali domestici ecco che il mestiere seo potrebbe diventare molto ma molto pesante.

    Il grosso del compito, a quel punto, passarebbe in mano al wm, a chi crea il contenuto e non a chi lo ottimizza.

    Da una parte corrisponderebbe anche alla fine di un certo vecchio stile di far spam, sarebbe un bel ripulisti, da un'altra non da meno penalizzerebbe fortemente chi ancora lavora con passione sulla lunghezza dei titoli, sugli h1 e cose del genere.

  45. #45
    Moderatore L'avatar di paocavo
    Data Registrazione
    Mar 2006
    Località
    Lecce, Italy
    Messaggi
    1,012
    Aggiungi paocavo su Facebook Aggiungi paocavo su Linkedin
    Citazione Originariamente Scritto da agoago Visualizza Messaggio
    Ho installato il programma che e' alla base del video in discussione:

    http://www.opencyc.org/

    Funziona bene, peccato ci siano poche relazioni "preimpostate", ma del resto il programma deve servire nell'intento per essere adattato alle necessita' personali dei vari utilizzatori, e non per fornire un prodotto pronto all'uso per tutti.
    Ciao Ago!
    hai già provato WordNet?
    Inoltre OpenCyc, se non erro, si può interfacciare ed arricchire (semanticamente) con WordNet

  46. #46
    User
    Data Registrazione
    Sep 2005
    Messaggi
    451
    "Se questo nuovo sistema fosse implementato in modo "pesante" di fatto stravolgerebbe molte serp, premiando probabilmente pagine ricche di contenuti, di "risposte", piuttosto che quelle pagine che ora sono premiate perche' propongono al loro interno prevalentemente i termini delle query, anzi a volte solo quelle..."

    E' già cosi da tempo per quanto mi risulta.. Solo che nessun SEO l'ha capito ma i più si fossilizzano sulle chiave, in quanto nel mercato Italiano spesso si vende quello.

  47. #47
    L'avatar di Giorgiotave
    Data Registrazione
    Oct 2004
    Località
    Monasterace
    Messaggi
    40,164
    Visita il canale Youtube di Giorgiotave
    Citazione Originariamente Scritto da uMoR Visualizza Messaggio
    "Se questo nuovo sistema fosse implementato in modo "pesante" di fatto stravolgerebbe molte serp, premiando probabilmente pagine ricche di contenuti, di "risposte", piuttosto che quelle pagine che ora sono premiate perche' propongono al loro interno prevalentemente i termini delle query, anzi a volte solo quelle..."

    E' già cosi da tempo per quanto mi risulta.. Solo che nessun SEO l'ha capito ma i più si fossilizzano sulle chiave, in quanto nel mercato Italiano spesso si vende quello.
    Premesso che il SEO non è una cosa certa, tutto quello che si sa è che sicuramente Google premia pagine di risposta, quasi quasi Landing Page.

    Ad esempio, leggesi thread sui Quality Rater, figura esistente in Italia dal 2004.

    Mi risulta che ci siano parecchi SEO in Italia che creano siti proprio per quel motivo

    Ai motori interessa che gli utenti trovino le risposte e con le landing si danno delle risposte. Tipo la storia del super trust di Wikipedia.

    Giorgio Taverniti Blog. FastForward: su YouTube ogni Martedì!

    Tutta la SEO in 23 ore: 9 diversi moduli tematici, 34 lezioni, questo è il Videocorso SEO del 2017!


  48. #48
    Esperto L'avatar di agoago
    Data Registrazione
    Apr 2005
    Messaggi
    481
    Paocavo scrive:

    "hai già provato WordNet? "

    L'ho scaricato l'anno scorso perche' ha gli archivi leggibili e mi sono serviti come base di lavoro. A parte questo non sono stato capace di sfruttarlo probabilmente come andrebbe fatto.
    E' una fortuna ma soprattutto un segno di civilta' esemplare che moltissimo materiale sul web sia di libero e gratuito accesso, se nella vita reale fosse anche solo un pochino cosi' vivremmo tutti piu' felici e meno ignoranti.

    uMoR scrive:

    "E' già cosi da tempo per quanto mi risulta.. Solo che nessun SEO l'ha capito ma i più si fossilizzano sulle chiave, in quanto nel mercato Italiano spesso si vende quello."

    Giorgiotave aggiunge:

    "Ai motori interessa che gli utenti trovino le risposte e con le landing si danno delle risposte."


    uMoR ha il dono della sintesi, e in 2 righe riesce a comprimere 3 pagine di concetti. Sapendo cosa intendeva dire (per esteso) me ne faccio portavoce nonche' divulgatore.

    Oggi (e da qualche tempo a questa parte) i motori tendono a calcolare-valutare sempre di piu' il "peso" di un sito piuttosto che il peso delle singole pagine che lo formano.
    Pertanto non e' tanto importante che una pagina punti a dare risposta ad una data query ma che sia parte di un sito che tratti ampiamente dell'argomento richiamato dalla query stessa query.

    E' lo stesso concetto che c'e' alla base della teoria che gli accessi siano distribuiti pagina per pagina in base al valore globale del sito (suddiviso tra le varie pagine) e non in base al valore di ogni pagina a se stante.

    ----

    Ammesso (ma ad oggi e' tutto da dimostrare che questa teoria sia valida) ed ipotizzato cio', non solo la landing page perde molto del suo classico valore se non inserita in un insieme di landing page che trattano in modo ampio ed approfondito un argomento, ma non bastesse, in base ai futuri intenti proposti nel video, non sara' cosi' facile approfondire un argomento semplicemente riportando nei testi le key principali (e parenti prossimi delle stesse) con contenuti "vicini".

    Per capirci, per ridurre tutto con un discorso piu' semplicistico che semplice, se io volevo vendere "scarpe rosse con tacco spillo" prima potevo cimentarmi con una pagina che trattava ampiamente di scarpe rosse con tacco a spillo.

    Poi (oggi) dovrei anche inserire quella pagina in un sito tipo scarpe.com che tratta ampiamente di scarpe ed eccessori, sito che dovrebbe contenere e valorizzare anche la mia landing page per "scarpe rosse con tacco spillo".

    Ma con la futura introduzione del linguaggio naturale questo non bastera' piu'.

    --------

    Il sito contenente la nostra landing page dovra' anche parlare del mal di schiena tipico di chi indossa le scarpe con i tacchi le prime volte, degli aspetti psicologici di chi si ritrova 10 cm piu' alto del solito, e via dicendo...

    Argomenti che potrebbero non nominare-contenere le parole tacchi o scarpe, ma che sono naturalmente associati dalla mente umana al concetto di scarpe con i tacchi.

    ---------

    Pertanto, per un wm che conosce profondamente l'argomento del proprio sito nessun problema, dovra' ampliarlo un bel po' e question finita.

    Ma per quei seo che sono abituati ad ottimizzare siti o a creare landing page usando le key principali e le loro derivate estrapolandole dai vari db di adwords, overture etc etc, ecco la vero ardua.

    --------

    E' ardua ma non impossibile, perche' si sa l'inteligenza artificiale non la usano solo i motori (purtroppo per loro).

    Ricapitoliamo, il problema e'-era scovare automaticamente "mal di schiena" partendo dalla key "scarpe con tacco".

    O "mamma con bambino" partendo dalla key "persone felici".

    Tramite i classici db non e' possibile, neanche scendendo in profondita' per ogni sotto key e relative associate. Tra mal di schiena e tacchi non c'e' nessuna relazione nei db delle key.

    E' questo che mi ha bloccato mesi fa, ma poi la soluzione si e' palesata proprio grazie all'uso di programmi come quello di Paolo di clustering K-means, e disponendo di un archivio "mostruoso", archivio che si ottinene dalla catalogazione di milioni di pagine presenti sul web.

    In questa maniera il programma identifichera' come parole vicine-importanti per chi tratta di mal di schiena anche la key scarpe con tacco, e poi il gioco e' fatto.

    A volte bisogna fare dei passaggi intermedi, ma il principio e' lo stesso, si usano gli insiemi, il risultato non e' meraviglioso ma almeno e' un primo passo.

    Conoscendolo, credo fosse questo che intendeva uMoR.

  49. #49
    User
    Data Registrazione
    Sep 2005
    Messaggi
    451
    Si era quello che intendevo ago, grazie.

    "Premesso che il SEO non è una cosa certa, tutto quello che si sa è che sicuramente Google premia pagine di risposta, quasi quasi Landing Page."

    Non sono assolutamente d'accordo. Spesso si associa al motore di ricerca il cappello magico come se facesse cose stravaganti, algoritmi mai discussi, tecniche mai studiate.. In realtà i motori non fanno altro che prendere gli studi delle varie università e metterli insieme!

    E' vero che nessuno conosce gli algoritmi di ranking dei motori, ma avere solide basi consente di capire le problematiche che devono affrontare gli stessi e soprattutto di capire le cose dal loro punto di vista. Si può stare a parlare per ore ed ore di quality rater, tag title, h1 e così via ma quanti hanno mai provato a spiderizzare il web e rendersi conto di come stanno veramente le cose?

    Dopo aver studiato lo studiabile su:
    information retrieval, natural language processing, clustering, metodi di compressione (indici documenti immagini mp3 video), crawling, text mining (unstructured data), calcolo distribuito, calcolo parallelo........

    E dopo aver applicato questi concetti ogni giorno assicuro a chiunque che ci si rende conto di come le cose di cui discutiamo ogni giorno abbiano un senso molto profondo.

    Tutto questo per dire che in realtà dei motori di ricerca si sa molto più di quanto si possa immaginare, basta studiare.

  50. #50
    Esperto L'avatar di nbriani
    Data Registrazione
    May 2005
    Località
    Guadalajara, Mexico
    Messaggi
    1,944
    Segui nbriani su Twitter Aggiungi nbriani su Google+ Aggiungi nbriani su Facebook Aggiungi nbriani su Linkedin Visita il canale Youtube di nbriani
    Citazione Originariamente Scritto da agoago Visualizza Messaggio
    Ricapitoliamo, il problema e'-era scovare automaticamente "mal di schiena" partendo dalla key "scarpe con tacco".

    O "mamma con bambino" partendo dalla key "persone felici".

    Tramite i classici db non e' possibile, neanche scendendo in profondita' per ogni sotto key e relative associate. Tra mal di schiena e tacchi non c'e' nessuna relazione nei db delle key.

    E' questo che mi ha bloccato mesi fa, ma poi la soluzione si e' palesata proprio grazie all'uso di programmi come quello di Paolo di clustering K-means, e disponendo di un archivio "mostruoso", archivio che si ottinene dalla catalogazione di milioni di pagine presenti sul web.

    In questa maniera il programma identifichera' come parole vicine-importanti per chi tratta di mal di schiena anche la key scarpe con tacco, e poi il gioco e' fatto.
    Anche di piu'... il MDR , identificherà come keyphrase "valida" "mal di schiena" proprio anche grazie allle eventuali numerose co-occorrenze con "scarpe con tacco" ...

    e le keyphrases "valide", si sa, sono una manna oggi come oggi

    Del resto i MDR dispongono di archivi sterminati su cui applicare i propri software di "text mining" , un vantaggio non indifferente quando dici

    E' ardua ma non impossibile, perche' si sa l'inteligenza artificiale non la usano solo i motori (purtroppo per loro).
    Fattostà, secondo me, la possibile individuazione del numero maggiore possibile di "keyprhases" valide di un cluster di interesse è determinante per la "costruzione" anche di singoli documenti web (non solo di siti) ... per non parlare poi di saper "capire" la keyphrase buona dentro le query di interesse...


    Averne di Cavoni e Agoaghi in giro ...


    Nicola

+ Rispondi alla Discussione
Pagina 1 di 2 12 UltimaUltima

^ Permessi di Scrittura

  • Tu non puoi inviare nuove discussioni
  • Tu non puoi inviare risposte
  • Tu non puoi inviare allegati
  • Tu non puoi modificare i tuoi messaggi
  •  
  • Il codice BB è Attivato
  • Le faccine sono Attivato
  • Il codice [IMG] è Attivato
  • Il codice [VIDEO] è Attivato
  • Il codice HTML è Disattivato
  • Trackbacks Attivato
  • Pingback Attivato
  • Refback Attivato

SEO by vBSEO 3.6.0 PL2 ©2011, Crawlability, Inc.