Le ipotesi sono testate sviluppando scenari in cui determinati risultati sono coerenti con l'ipotesi che sia vera o falsa, quindi sperimentando o ricercando per vedere se l'ipotesi corrisponde alla realtà. Nelle statistiche, il test di ipotesi ha un significato specialistico che implica fare una valutazione di probabilità delle ipotesi prima di sperimentare.
L'esempio classico di un test di ipotesi statistica è quello del lancio di una moneta. Le monete hanno due lati, quindi l'ipotesi nulla è che la moneta sia bilanciata e che ogni parte abbia il 50% di probabilità di venire in un lancio. Se l'esperimento viene quindi eseguito e i risultati divergono in modo significativo dai risultati previsti dall'ipotesi nulla, è necessario sviluppare una seconda ipotesi per tenere conto dell'esito imprevisto.
In questo scenario, un quarto può essere capovolto 100 volte per determinare se sia veramente bilanciato. L'ipotesi nulla è che la popolazione di risultati dovrebbe cadere vicino a 50 teste e 50 code se la moneta è bilanciata. Qualsiasi divergenza significativa dalla suddivisione prevista per il 50-50 è probabilmente dovuta ad alcuni fattori come una moneta sbilanciata. Se il test risulta in 80 teste e 20 code, si dice che l'ipotesi nulla sia stata testata e rifiutata.