![]() |
![]() |
|
| Condividi questo contenuto nei Social Network: |
|
Tweet |
|
|
|
Ti stiamo aspettando: Registrati subito e gratis. Entra a far parte di una delle comunità più attive in Italia. Se hai dimenticato i tuoi dati li puoi recuperare subito. |
||||
|
|||||||||
Hey Amico Visitatore, Condividi con noi le tue idee e la tua conoscenza Aprendo una nuova discussione nella sezione SEO Focus |
|
|
LinkBack (4) | Strumenti di discussione |
|
|
#16 (permalink) |
|
User
|
Tutto ciò implica anche che sarebbe il caso di scrivere sempre frasi sensate. Insomma, tra le altre cose, dovrebbero precipitare nella lista dei risultati supplementari tutte quelle pagine che contengono frasi prive delle stop words. Esempio:
1. "Casa a Milano" : buono 2. "Casa Milano": cattivo |
|
|
|
|
|
#17 (permalink) | |
|
User
Data di registrazione: Sep 2006
Messaggi: 160
|
Quote:
è curioso però il fatto che se io cerco -Caglieri mi offre la soluzione alternativa e mi da i risultati relativi alla chiave cercata -a Caglieri mi offre la soluzione alternativa e i risultati riguardano proprio quella -ferie Caglieri addirittura non mi da neanche la soluzione alternativa e mi da direttamente i risultati come se avessi cercato ferie cagliari (ma i risultati di quest'ultima sono diversi in realtà) | |
|
|
|
|
|
#18 (permalink) | |
|
Moderatore
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
|
Quote:
:Browser Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322; Google-TR-4-GT) - Page /Default.asp - mDate 15/01/2007 - mTime 13.37.35 - OS unknown - Referer http://www.google.it/search?sourceid=navclient&hl=it&ie=UTF-8&rls=GGIC,GGIC:2006-49,GGIC:it&q=paolo+cavone - UA Netscape - UAVersion 4.00 - UserIP 72.14.192.13 (United States - California - Mountain View - Google Inc) E già... sembra proprio che dovremo fare i conti con l'analisi semantica delle frasi e saranno queste da dover posizionare . Grazie 1000 per i link appena posso mi studio tutto!!![]() | |
|
Ultima modifica di paocavo : 16-01-07 17:16. |
||
|
|
|
|
|
#20 (permalink) | ||
|
Moderatore
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
|
Quote:
Stay tuned... Quote:
![]() | ||
|
|
|
|
|
#22 (permalink) | |
|
Moderatore
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
|
Quote:
Ecco la discussione: http://www.giorgiotave.it/forum/labo...eneration.html | |
|
|
|
|
|
#23 (permalink) |
|
ModSenior
|
Una notte insonne era cio' che ci voleva per poter affrontare con calma quella davvero interessante discussione che ti ringrazio di averci postato e pure gli altrettanto interessanti documenti e tools del tuo sito...
Pare proprio che i Vs studi siano davvero fortemente correlati ai brevetti legati all'indicizzazione per Frasi. Ottimo! Non ho capito se anche Agoago lavora o ha Tool simili ai tuoi ma mi è parso nella discussione che il suo interesse va maggiormente verso la clusterizzazione e la rilevanza semantica di keywords e gruppi di keywords di un testo piuttosto che nella estrapolazioni di frasi predominanti si ma pure di senso compiuto e di rilevanza di contenuto, come mi pare siano piu' orientati i tuoi studi e il tuo interessantissimo tool Summarizer... Magari se Agoago interverrà potrà farmi capire meglio le premesse di quella discussione e il tipo di lavoro e di strumenti che utilizza. Visto il topic del thred mi concentrei infatti su alcuni spunti della Vs discussione piu' vicini al concetto e all'argomento "frasi": Un motore basato sulla indicizzazione di frasi e non di keyword su cui si basano tutti i brevetti che stiamo analizzando è certamente un motore che ha "esigenze" diverse in fase di "spiderizzazione" e pure "vantaggi" e possibilità diverse in fase di ranking e di individuazione di risultati rilevanti (e dello spam!) . Nella premessa del brevetto si legge: I Mdr basati sul boolean-matching delle singole keywords di una query hanno limiti conosciuti: Una ricerca come "Pastore Tedesco" mostra documenti ad alto ranking per il termine "tedesco" ma che niente hanno a che fare con i cani che è l'evidente concetto richiesto dall'utente... Al massimo, (si legge sempre nel brevetto) alcuni sistemi avanzati hanno utilizzato operatori umani per selezionare alcune "frasi" o concetti con cui sono stati indicizzati i documenti ( e questo già spiega molte cose, riguardo a ranking anomali per alcune keyphrases , no? ). Inoltre tentare la strada del risconoscimento di ogni possibile frase porta a richieste in termini di risorse molto elevate: una lingua formata da 200.000 termini avrebbe 3,2 x10 alla 26 potenza di possibili frasi formate da 3,4,5 parole... Altri sistemi si sono invece basati sulla co-occorenza analizzata di alcune singole parole detrminate : tipo "Presidente" con "casa" o "bianca" ma anche questo porta a serp che presentano si cluster di concetti ma sempre legati alle singole keyword componenti la query... Ecco perchè un sistema in grado di rilevare automaticamente frasi su "larga scala" e di indizzare e ordinare i documenti in base alle frasi ai concetti indicizzati puo' essere determinante... da qui il brevetto... (la prima domanda che ho è : ma quando parlano di mdr basati sull'indicizzazione per frasi, questa è intesa come indicizzazione che sostituisce quella per keyword singole o che la affianca... secondo voi? Certo che se uso una query singola il metodo di information retrieval dovrebbe essere quello classico, no? quindi io le vedrei affiancate... )Se queste sono le basi , lasciando per un attimo da parte lo sforzo di capire come un mdr lavora per estrapolare, clusterizzare e indicizzare automaticamente frasi in qualunque lingua e di qualunque lunghezza (lasciamo il compito agli ingegneri) , sarebbe incvece interessante sviluppare insieme (agoago? Paocavo? - il primo punto fondamentale: come si riconoscono le frasi di un testo di un documento ipertestuale ? .. quali sono i concetti base? l'uso della punteggiatura, l'utilizzo delle congiunzioni , delle stopwords, l'utilizzo dei tag h1, h2, h3 o altro, come cambia o come va reinterpretato? e correlato, come si distinguono le frasi in una query? - cosa possiamo dire e come possiamo ragionare , in relazione alla costruzione di un testo, pensando che il MDR esegue le sue analisi di rilevanza e di indicizzazione delle frasi a livello globale e non sul ns singolo testo .... domanda: cio' vuol dire che si devono utilizzare possibilmente frasi a) corrette b) diffuse c) tipicamente legate all'argomento ???? - Un altro punto cruciale è quindi il concetto legato alla individuazione di frasi "buone" (e frasi "Cattive ") ...cioè frasi con sufficente frequenza e simile tipologia di utilizzo. Vale quanto sopra? - Poi dovremo parlare di criteri di rilevanza e classificazione di frasi : basterà utilizzare gli stessi criteri che utilizzavamo per le keywords? (prominenza, presenza in tag precisi, url, dominio.... ecc) -Parlando poi di co-occorrenza di frasi il brevetto parla chiaramente di cluster di concetti e di ranking di documenti legati alla presenza di frasi correlate aspettate all'interno di un documento... come individuare le migliori frasi correlate? Ho un suggerimento per Cavone: Un tool che analizza i testi dei primi cento documenti di una derminata serp e ne estrapoli le frasi rilevanti (su tutto il campione) magari creando anche dei cluster con frase padre e frasi correlate... Potemmo cosi' simulare (in piccolo) il MDR nella ricerca delle frasi rilevanti e di quelle corrlate di maggior forza da utilizzare per i ns testi... - Altro punto interessante e da capire del brevetto è il suo utilizzo nel determinare documenti duplicati (qui al punto 0023): mi pare di capire che ogni documento (di un dominio?) viene associato ad un numero limitato di "sentenze" (formate da frasi correlate intorno ad un concetto) e che indicizzazioni successive di documenti che matchano le stesse sentenze verranno considerate contenuto duplicato.... questo vuol dire cercare di caratterizzare le pagine di un sito per "sentenze" ? - Infine lo spam: mi pare di capire che il metodo si riferisca allo spam da "long tail spam engine" ... si parla infatti di siti individuatri grazie all'elevato (fuori deviazione standard) numero di "Frasi buone" presenti... se la media è 30/40 per sito probailmente un sito che ha 1000/2000 cluster di frasi è probabile che sia un bello spam ... ( o una "povera" e semplice directory? Voi che dite? Nicola |
|
|
|
|
|
#25 (permalink) | |
|
User
Data di registrazione: Dec 2006
Messaggi: 86
|
Quote:
![]() | |
|
|
|
|
|
#27 (permalink) | |||
|
Moderatore
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
|
Quote:
Quote:
Quote:
Continua... | |||
|
|
|
|
|
#28 (permalink) | |||||||
|
Moderatore
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
|
Quote:
Quote:
Il nuovo algoritmo credo andrà a strvolgere e sostituire completamente il vecchio. Quote:
Quote:
Quote:
Quote:
Quote:
continua... | |||||||
|
|
|
|
|
#29 (permalink) | |
|
Moderatore
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
|
Quote:
![]() | |
|
|
|
|
|
#30 (permalink) | |
|
Moderatore
Data di registrazione: Mar 2006
Ubicazione: Lecce, Italy
Messaggi: 1,007
|
Quote:
... | |
|
|
|
| Tags: brevetti google, google phraserank |
| Strumenti di discussione | |
|
|
LinkBacks (?)
LinkBack to this Thread: http://www.giorgiotave.it/forum/seo-focus/27025-brevetti-google-google-phraserank.html
|
||||
| Scritto da | For | Type | Data | |
| Brevetti Google: PhraseRank, information retrieval basato sulle frasi | This thread | Trackback | 22-02-07 13:54 | |
| hit parade del webmarketing | This thread | Refback | 19-02-07 20:32 | |
| » Google PhraseRank - nuovo brevetto - Web Marketing e Posizionamento | This thread | Pingback | 15-01-07 22:26 | |
| [Brevetto Google] Google PhraseRank | This thread | Trackback | 15-01-07 13:51 | |
