Mauro Ginelli

Pagerank: definizione, funzionamento e calcolo

In parte stimolato dai commenti ricevuti su questo blog ed in parte dalle domande che ogni tanto ricevo da amici e conoscenti, provo a riportare qualche concetto chiave sul famoso sistema di Google.

Il Pagerank è il sistema ideato dai due fondatori di Google, Larry Page e Sergey Brin, quando erano studenti presso l’Università di Stanford (si veda l’articolo originale: The Anatomy of a Large-Scale Hypertextual Web Search Engine).

Il Pagerank consente di classificare le pagine Web in ordine di importanza, sfruttando la rete di collegamenti (link) associati alle singole pagine per determinarne il valore. Il Pagerank, quindi, misura il valore di una singola pagina e non, come erroneamente si può ritenere, il valore di un sito nel suo complesso; all’interno di un sito, insomma, possono esserci pagine con Pagerank differente (ed è anzi una situazione molto diffusa).
L’origine del nome, però, non è da attribuirsi tanto al concetto di pagina, quanto al cognome del suo ideatore, Larry Page. Il Pagerank è l’indicatore di Larry Page e misura il valore delle pagine: nomen omen, come dicevano i latini.

L’intuizione dietro l’elaborazione dell’algoritmo di calcolo del Pagerank, se oggi appare quasi banale, allora costituì un’innovazione radicale, perché offriva per la prima volta un sistema semplice per valutare l’autorevolezza e la popolarità delle pagine web, mutuando un concetto diffuso nel mondo accademico. Le pubblicazioni universitarie di professori e ricercatori acquisiscono importanza ogni volta che vengono citate da un’altra pubblicazione; in altri termini, diventano tanto più autorevoli quanto più sono citate da altre fonti, meglio ancora se di argomento collegato. Trasponendo il concetto nel mondo di Internet, una pagina web acquista maggior valore per Google all’aumentare del numero e della qualità dei link in entrata.
Grazie al Pagerank, quindi, si poteva rivolgere lo sguardo all’esterno delle pagine web, in un’epoca in cui tutti i motori di ricerca offrivano i risultati nelle SERP (le pagine dei risultati) basandosi solamente sui contenuti offerti (cosiddetti criteri on-site, in contrapposizione ai criteri off-site, spesso sintetizzati anche con l’espressione link popularity).

Vale la pena soffermarsi su un elemento importante, talvolta trascurato, nel calcolo del Pagerank: oltre alla numerosità dei link in entrata, ad influire sul Pagerank conta l’autorevolezza dei link, come ben espresso nella pagina informativa di Google:

[…] Google interpreta un collegamento dalla pagina A alla pagina B come un “voto” espresso dalla prima in merito alla seconda. Tuttavia, non si limita a calcolare il numero di voti, o collegamenti, assegnati a una pagina. Oltre a effettuare questo calcolo, Google prende in esame la pagina che ha assegnato il voto. I voti espressi da pagine “importanti” hanno più rilevanza e quindi contribuiscono a rendere “importanti” anche le pagine collegate.

Ogni pagina conosciuta e archiviata nei database di Google ha il suo Pagerank, grazie ad un processo di calcolo praticamente ininterrotto, come ben spiegato da uno degli ingegneri più famosi di Google, Matt Cutts, in un post sul suo blog. Ad intervalli più o meno regolari, nell’ordine dei tre mesi circa, il Pagerank viene “esportato”, così che anche gli utenti possano conoscere un valore approssimativo, misurabile in una scala da 1 a 10.

Il metodo più semplice per conoscere il Pagerank di una pagina rimane quello di scaricare ed installare la Google Toolbar, che consente di vedere il Pagerank di una pagina web attraverso una barretta verde, con valori che vanno appunto da 0/10 a 10/10, come nella figura sottostante.


Esistono numerosi siti che permettono di interrogare Google per conoscere il Pagerank “pubblico” (per intenderci, quello che viene esportato ad intervalli più o meno regolari).
Data la struttura di Google, che si basa su diversi datacenter non sempre allineati (le modifiche possono essere all’ordine del giorno), anche il valore “pubblico” può fluttuare.

Un buon tool che aiuta a comprendere queste fluttuazioni è offerto dal sito www.raketforskning.com della svedese Voidsoft AB: è sufficiente andare all’indirizzo http://livepr.raketforskning.com/ ed inserire la pagina di cui si vuole conoscere il Pagerank, per interrogare contemporaneamente 50 differenti datacenter.

Un’ultima considerazione. Troppe volte ci si imbatte in discussioni tra webmaster preoccupati per il Pagerank dei propri siti. Valga la pena riportare ancora un estratto delle informazioni offerte da Google:

[…] Google integra PageRank con sofisticate procedure di ricerca testo per trovare le pagine che sono rilevanti e rispondono ai criteri di ricerca indicati

Poniamo l’accento sulla seconda parola: integra. Non facciamone un dramma. Ci sono decine, forse centinaia di altri fattori su cui spendere energie per migliorare il posizionamento delle pagine di un sito. Non di solo Pagerank vive il webmaster.

Technorati Tags: Pagerank, Google, calcolo, misurazione