La ridondanza dei dati può causare anomalie dei dati in un database - più comunemente errori di inserimento, cancellazione e aggiornamento. Il processo di normalizzazione dei dati aiuta ad eliminare la ridondanza dei dati e le relative anomalie risultanti.
La ridondanza dei dati si verifica quando è possibile trovare una specifica parte di dati in più aree del database. Un esempio comune potrebbe essere la banca dati di un'università o di un college di iscrizione corrente ai corsi. Uno studente potrebbe essere iscritto a diversi corsi, quindi il record del singolo studente può essere riprodotto più volte. In uno scenario di produzione, un singolo fornitore può essere utilizzato per vari progetti e prodotti.
È importante eliminare l'occorrenza della ridondanza dei dati mantenendo l'integrità dei dati attraverso il processo di normalizzazione a più fasi. In genere la ridondanza genera tre anomalie dei dati comuni o casi in cui i dati sono incoerenti.
- Anomalia di inserimento - in cui i dati non possono essere memorizzati o aggiornati a meno che un altro dato non venga memorizzato nello stesso momento. Nell'esempio dei record degli studenti, ciò potrebbe verificarsi se non è possibile inserire un record studente fino a quando non si sono iscritti a un corso.
- anomalia di aggiornamento - dove una delle copie di un record viene aggiornata mentre l'altra no; tutte le copie devono essere aggiornate simultaneamente.
- Anomalia di cancellazione - questo si verifica quando l'eliminazione di un pezzo di dati significa che anche altre informazioni vengono perse. Negli esempi degli studenti, questo potrebbe accadere se l'eliminazione di un corso significasse anche l'eliminazione dei relativi record degli studenti.