Ti sei perso il VI Convegno gt? Forse puoi rimediare... www.convegnogt.it X Chiudi

Visualizza un messaggio singolo
Vecchio 28-04-07, 04:55   #1 (permalink)
nbriani
ModSenior
 
L'avatar di nbriani
 
Data di registrazione: May 2005
Ubicazione: Firenze
Messaggi: 1,938
Invia un messaggio tramite MSN a nbriani Invia un messaggio tramite Skype a nbriani
Nuovi Brevetti di Google: Cutts e Jeffrey Dean fra gli autori

Ci sono anche Matt Cutts e l' amico (... ) Jeffrey Dean tra gli autori di due nuovi interessanti Brevetti di Google che riguardano ulteriori aspetti dell'utilizzo dei "dati storici" in funzione del Ranking pubblicati appena due giorni fa e di cui mi pare che ad oggi non sia ancora uscito molto qui da noi...

L'ultima "mandata" di brevetti (quelli cosiddetti del "Phrase Rank") aveva infatti spostato la nostra attenzione sulle infrastrutture e sui metodi di indicizzazione, con la descrizione dell'indicizzazione per frasi (che molte ripercussioni ha/potrebbe avere nelle serp di oggi) e degli archivi di indicizzazione secondari (che tanto fanno parlare di se
quando si affrontano temi come i risultati supplementari o i risultati omessi).

Ma di dati "storici" non ne parlavamo da tempo...

Dei "mitici" brevetti sui "dati storici", infatti, se ne discusse con grande attenzione e partecipazione ormai diversi mesi fa, con un fiorire di interpretazioni e supposizioni su quell'enorme mole di dati e di nuovi possibili elementi di ranking, ma di cui non si aveva , allora, certezza del loro effettivo utilizzo..

...poi uscirono le "interessantissime" pubblicazioni riguardo "Big table" a darci conferme e prove sull'utilizzo di dati "storicizzati" da parte di Google, attraverso una precisa descrizione della propria infrastruttura di archivio dati.

Con qualcuno poi, ci divertimmo quindi ad ipotizzare come Google potesse tenere conto della variazione storica di uno dei dati e degli elementi fondamentali alla base dei propri algoritmi: "la variazione del numero di Link nel tempo" ai fini del ranking di un documento...

... ed ecco che oggi, ma non era certo dubitabile, Google ci presenta i relativi brevetti ufficiali :

DOCUMENT SCORING BASED ON LINK-BASED CRITERIA


DOCUMENT SCORING BASED ON DOCUMENT INCEPTION DATE

Il primo proprio focalizzato sul tema: "A system may determine time-varying behavior of links pointing to a document, generate a score for the document based"
Per una rapida comprensione del brevetto consiglio di leggere (come sempre in questo tipo di documenti/brevetti) il "Summary of invenction" che ovviamente non fornisce una descrizione "puntuale" delle formule di ranking ma dei metodi di calcolo che danno una idea abbastanza precisa di cio' che viene tenuto in conto:

concetti come appunto, la variazione nel tempo dei link ricevuti, il concetto di "freshness" di un documento legato alla "freshness" dei link che lo puntano, il concetto di superamento di soglia media dei link ricevuti nel tempo....

Quella della "media" è un metodo di lavoro ricorrrente nei sistemi e negli algoritmi del motore di ricerca, dove le valutazioni
delle "influenze" di dati e fattori contestuali ad un singolo documento, non sono MAI delegate a studi, formule e/o considerazioni esterne e/o "umane" o comunque frutto di ragionamenti e /o supposizioni, ma sempre valutate in funzione del raffronto con i valori medi di tali dati nell'intero universo dei documenti archiviati...

Anche il secondo brevetto è davvero interessante e per certi versi sorprendente: "A system may determine a document inception date associated with a document, generate a score for the document based at least in part, on the document inception date"
Una elemento di ranking basato sulla data di creazione di un documento... (che prima o poi doveva pur essere tenuta in conto.. finalmente ) e fin qui nulla di eccezionale , anche se si potrebbe anche ritornare a parlare di Sand-Box (o no? ) ma ben piu' interessante mi è parso uno dei punti del brevetto che descrive uno dei possibili metodi da utilizzare: la verifica in base alla query fatta, della data di creazione media dei documenti relativi alla query e la determinazione di un punteggio relativo al discostamento medio da tale data... davvero non ci avevo mai pensato ...

Comunque continua l'evoluzione di Google e continua sempre piu' affascinante la sfida tecnologica e lo sviluppo dell' information retrieval sul web... e meno male che in america sono abituati a brevettare tutto, che almeno continuiamo ad avere spunti per studiare e lavorare...


Nicola

"GT Bibliografia" (thred citati) :

Google Phrase Rank
Google Big Table
Brevetti dati storici di Google (2005)
Congetture sull'importanza della variazione nel tempo del numero di BL
__________________
Web Marketing Consultant

Focus on:
IV Convegno GT !

Ultima modifica di Giorgiotave : 28-04-07 14:50. Motivo: modificato un link
nbriani non in linea   Rispondi citando