ok riparto dall'inizio, pero' qua sta venedo fuori un casino di
topic..
** DATA **
inception data = data d'inizio, probabilmente la prima volta che il crwaler individua il documento
La "inception data" puo' essere usata per generare ( o modificare ) il punteggio associato al documento. Il termine "data" e' usato largamente e puo' includere date, e misurazioni di fate. Come descritto piu' avanti ci sono diverse tecniche per calcolare la "inception data", alcune di esse possono essere influenzate da terze parti, altre no. Ognuna di queste tecniche, o la combinazione di piu' di esse, puo' essere utilizzata per determinare l' "inception data" di un documento.
Un modo per individuarla e' determinato dalla prima volta in cui il documento viene visto (passaggio del
crawler, segnalazione al motore, combinazione delle due o in altri modi). Oppure puo' essere determinata dalla prima volta che il crawler trova un
link al documento.
Un altro modo puo' essere quello dell'eta' del dominio in cui il documento e' ospitato.
Un altro modo ancoro, la prima volta che un documento e' referenziato in un altro, ad esempio tramite un articolo di news,
newsgroup, mailing
list, oppure combinazione di due o piu' di questi aspetti.
Oppure la prima volta nella quale il documento include un certo numero di pagine.
Un altro modo ancora il timestamp associato dal
server al documento oppure altri sistemi non menzionati.
Il motore puo' assegnare punteggi diversi a seconda dell'"inception data" perche' si presume che un documento "giovane" avra' meno
backlink di uno vecchio e quindi avra' un punteggio molto minore.
Questo vuol dire che per esempio un documento con l'"inception data" di ieri che e' referenziato da 10 back link avra' un punteggio maggiore di un un documento vecchio di 10 anni referenziato da 100 backlinks. Tutto questo pero' e' relativo perche' tanti back links in poco tempo possono venir considerati come un tentativo di
spam al motore. La tendenza e' quella di abbassare il punteggio del documento per ridurre l'effetto di spam.
L'"inception data" puo' venir utilizzata anche per determinare il peso dei link che puntano al documento (es peso in baso ad unita' di tempo). Questo puo' venir usato anche in altro modo, per esempio dando un punteggio maggiore a documenti in cui i back links vengono generati piu' spesso.
Il punteggio basato sui link potrebbe per esempio essere modificato con questa formula:
H=L/log(F+2),
Dove la H si riferische ad aggiustamenti del valore dei link, la L il valore del rank passato (la famosa formula del
pagerank per intenderci..), e la F puo' riferirsi al tempo trascorso dall'"inception data".
+++++++++
riflessione mia, vediamo di capire questa formula
es
L = 50 (valore a caso di
page rank che passa un link)
F1 = 4 (unita' a caso, mettiamo 4 settimane)
F2 = 10 (unita' a caso, mettiamo 10 settimane)
link su pagina esistente da 4 settimane
H = 50 / log(4+2) = 64.25
link su pagina esistente da 10 settimane
H = 50 / log(12+2) = 43.62
quindi piu' si va avanti con il tempo e meno occorrono aggiustamenti sul valore dei link
+++++++++
Per alcune queries, i documenti piu' vecchi potrebbero essere molto favoriti nei confronti di quelli nuovi. Per questo motivo ci possono essere degli aggiustamenti in base alla differenza d'eta' dei due siti.