Ogni volta che cerchi qualcosa su Google, il motore di ricerca passa in rassegna le oltre 30 trilioni di pagine web esistenti su Internet e in appena mezzo secondo trova i primi 10 risultati che rispondono alla tua domanda. Come è possibile? In realtà Google non visita tutte le pagine di Internet ogni volta che gli chiedi qualcosa, ma memorizza le informazioni sulle pagine web nei suoi database e utilizza algoritmi che leggono quei database per decidere cosa mostrarti.
Questi database sono costruiti attraverso dei programmi chiamati spider, che scansionano regolarmente tutte le pagine web. Questo processo è sempre in corso: Google aggiunge costantemente nuove pagine al suo database o aggiorna le pagine quando cambiano. Quando esegui una ricerca Google prende la tua query – ovvero il testo che hai digitato nella barra di ricerca – e scandaglia il suo database per trovare le pagine web più rilevanti.
Per farlo, Google utilizza un algoritmo chiamato PageRank, che i fondatori di Google Larry Page e Sergey Brin hanno creato per la loro tesi di dottorato nel 1998. Page e Brin hanno notato che l'importanza di una pagina web può essere stimata osservando quali altre pagine importanti si collegano ad essa. Così, attraverso calcoli algebrici, PageRank assegna a ciascuna pagina web un punteggio basato sui punteggi PageRank di ogni altra pagina che vi rimanda, punteggi che dipendono a loro volta dalle pagine che si collegano a queste pagine, e così via.
Una volta che Google ha trovato tutte le pagine nel suo indice che menzionano la tua query di ricerca, le classifica quindi utilizzando PageRank ma anche altri criteri: considera ad esempio anche la posizione da dove è stata fatta la query o quanto recentemente è stata aggiornata una pagina web, e ignora i siti web che sembrano spam. Tuttavia, bisogna sempre tenere presente che l'algoritmo di ricerca di Google è in continua evoluzione, con aggiornamenti minori lanciati oltre 500 volte l'anno.