Connect.gt

Condividiamo idee e conoscenza dal 2003...
...dopo 17 anni una Nuova Storia è nata
Scopri di più

Il TrustRank (TR) è una tecnica di analisi semiautomatica per separare con efficacia le pagine web utili dallo Spam.

Molte pagine Spam sono generate soltanto con l'intenzione di ingannare i motori di ricerca e quindi l'utente. Queste pagine, principalmente generate per i motivi commerciali, usano varie tecniche per conquistare migliori posizioni di quelle che meriterebbero realmente nelle Serp dei risultati dei motori di ricerca. Mentre un umano esperto può identificare facilmente lo Spam, risulta invece troppo costosa la valutazione manuale di tantissime pagine.

Un metodo molto usato per migliorare i posisionamenti è aumentare artificialmente l'importanza percepita di un documento attraverso il complesso sistema di link. Il PageRank PR di Google e metodi simili per la determinazione dell'importanza relativa delle pagine web risultano da tempo manipolati ed inaffidabili.

Il metodo di TrustRank si basa sulla valutazione di fidati esperti su piccole selezioni di insiemi di pagine web. Una volta che pagine attendibili e selezionate sono identificate manualmente, un crawl estende questo concetto di attendibilità esternamente ricercando pagine similmente certe e fidate.

I ricercatori che hanno proposto la metodologia di TrustRank hanno continuato a raffinare il loro lavoro valutando i soggetti relativi, come misurazione della massa dello Spam.


--Andrez 07:26, Dic 13, 2006 (CET)


  • Questa pagina è stata modificata per l'ultima volta il 9 lug 2009 alle 02:05.
  • Questa pagina è stata letta 3 702 volte.