Il PageRank (PR) è un indice di importanza che Google attribuisce a ciascuna delle pagine archiviate.
L'indice di importanza di una pagina viene calcolato in base al numero di link sul Web che puntano ad essa e all'indice di importanza delle pagine che offrono il link.
Il valore di PageRank di ciascuna pagina è uno dei tanti fattori sfruttati da Google per migliorare l'ordine con il quale il motore di ricerca ordina i risultati delle ricerche: le pagine che mostrano valori di PageRank più alti otterranno, a parità di altri elementi, una posizione migliore rispetto alle pagine con valore di PageRank più basso.
Il calcolo del PageRank è stato progettato in modo da differenziarsi dal concetto di Link Popularity (LP), per molto tempo utilizzato dai motori di ricerca e coincidente col semplice numero di link che puntano ad una data pagina.
Mentre un motore che ordina i risultati di ricerca basandosi sulla Link Popularity può essere facilmente influenzato semplicemente facendo puntare molti link verso la pagina da rendere visibile, un motore basato sul PageRank è meno influenzabile dalla mera quantità dei link e più attento all'importanza delle pagine (ovvero al valore di PageRank) da cui i link provengono.
Per molti anni la posizione delle pagine nei risultati di ricerca di Google è stata fortemente influenzata dal valore di PageRank calcolato per ogni pagina, tanto che la corsa all'accumulo di PageRank è diventata nella comunità dei webmaster un vero e proprio fenomeno di massa. Per evitare che i risultati delle ricerche divenissero facilmente influenzabili dai gestori dei siti web, Google ha successivamente apportato delle modifiche ai propri criteri di posizionamento delle pagine in modo da ridurre l'influenza del PageRank e del suo accumulo.
Non per questo, il PageRank o PR ha perduto importanza tra le tecnologie utilizzate da Google, in quanto viene ancora largamente sfruttato per migliorare il risultato di diversi algoritmi, come quelli che stabiliscono quali pagine di un sito gli spider del motore debbano prelevare e quelli che decidono quale pagina considerare "canonica" tra eventuali doppioni trovati sul Web.
L'algoritmo completo per il calcolo del PageRank fa ricorso all'uso della teoria dei processi di Markov. Dalla formula inizialmente sviluppata dai fondatori di Google, Sergey Brin e Larry Page, è possibile comprendere come il PageRank viene distribuito tra le pagine:
PR[A] = (1 - d) + d ( PR[T1]/C[T1] + ... + PR[Tn]/C[Tn])
Dove: