Il PageRank (PR) è un indice di importanza che Google attribuisce a ciascuna delle pagine archiviate.

L'indice di importanza di una pagina viene calcolato in base al numero di link sul Web che puntano ad essa e all'indice di importanza delle pagine che offrono il link.

Il valore di PageRank di ciascuna pagina è uno dei tanti fattori sfruttati da Google per migliorare l'ordine con il quale il motore di ricerca ordina i risultati delle ricerche: le pagine che mostrano valori di PageRank più alti otterranno, a parità di altri elementi, una posizione migliore rispetto alle pagine con valore di PageRank più basso.

Il calcolo del PageRank è stato progettato in modo da differenziarsi dal concetto di Link Popularity (LP), per molto tempo utilizzato dai motori di ricerca e coincidente col semplice numero di link che puntano ad una data pagina.

Mentre un motore che ordina i risultati di ricerca basandosi sulla Link Popularity può essere facilmente influenzato semplicemente facendo puntare molti link verso la pagina da rendere visibile, un motore basato sul PageRank è meno influenzabile dalla mera quantità dei link e più attento all'importanza delle pagine (ovvero al valore di PageRank) da cui i link provengono.

Per molti anni la posizione delle pagine nei risultati di ricerca di Google è stata fortemente influenzata dal valore di PageRank calcolato per ogni pagina, tanto che la corsa all'accumulo di PageRank è diventata nella comunità dei webmaster un vero e proprio fenomeno di massa. Per evitare che i risultati delle ricerche divenissero facilmente influenzabili dai gestori dei siti web, Google ha successivamente apportato delle modifiche ai propri criteri di posizionamento delle pagine in modo da ridurre l'influenza del PageRank e del suo accumulo.

Non per questo, il PageRank o PR ha perduto importanza tra le tecnologie utilizzate da Google, in quanto viene ancora largamente sfruttato per migliorare il risultato di diversi algoritmi, come quelli che stabiliscono quali pagine di un sito gli spider del motore debbano prelevare e quelli che decidono quale pagina considerare "canonica" tra eventuali doppioni trovati sul Web.

Formula semplificata

L'algoritmo completo per il calcolo del PageRank fa ricorso all'uso della teoria dei processi di Markov. Dalla formula inizialmente sviluppata dai fondatori di Google, Sergey Brin e Larry Page, è possibile comprendere come il PageRank viene distribuito tra le pagine:

PR[A] = (1 - d) + d ( PR[T1]/C[T1] + ... + PR[Tn]/C[Tn])

Dove:

  • PR[A] è il valore di PageRank della pagina A che vogliamo calcolare
  • T1...Tn sono le pagine che contengono almeno un link verso A
  • PR[T1] ... PR[Tn] sono i valori di PageRank delle pagine T1 ... Tn
  • C[T1] ... C[Tn] sono il numero complessivo di link contenuti nella pagina che offre il link
  • d (damping factor) è un fattore deciso da Google e che nella documentazione originale assume valore 0,85. Può essere aggiustato da Google per decidere la percentuale di PageRank che deve transitare da una pagina all'altra e il valore di PageRank minimo attribuito ad ogni pagina in archivio.

  • Questa pagina è stata modificata per l'ultima volta il 3 apr 2014 alle 09:03.
  • Questa pagina è stata letta 35 189 volte.