I motori di ricerca hanno meccanismi diversi che li fanno funzionare, ma in genere implicano tre funzioni: cercare sul Web, elencare informazioni importanti che trovano in un indice e fornire risultati di query di ricerca basati su quell'indice. Si basano su algoritmi e classifiche per fornire risultati pertinenti.
Per effettuare ricerche sul Web, un motore di ricerca utilizza programmi automatici noti come spider. A partire da siti Web popolari, questi spider eseguono la scansione delle pagine Web e cercano parole significative. Trovano e seguono i collegamenti in ogni pagina per esplorare più pagine. Per manipolare il comportamento di questi spider, i proprietari dei siti Web possono utilizzare i meta tag per descrivere le loro pagine con parole chiave specifiche. I proprietari di siti web possono anche aggiungere protocolli di esclusione robot per segnalare agli spider di ignorare pagine specifiche.
Dopo la scansione, gli spider presentano i loro risultati nell'indice del motore di ricerca. Oltre ad elencare le parole e gli URL che contengono queste parole, un motore di ricerca può assegnare un peso a ogni voce nel suo indice. Il peso di una voce determina la frequenza con cui la parola viene utilizzata in una pagina e influenza il valore della voce nell'indice. Gli algoritmi vengono anche utilizzati per determinare le classifiche delle voci nell'indice. Ad esempio, l'algoritmo PageRank di Google valuta le pagine che sono frequentemente collegate da altre pagine.
Quando un utente invia una query, il motore di ricerca restituisce i risultati che ritiene più pertinenti. L'utente può perfezionare ulteriormente i risultati tramite gli operatori booleani.