Il data mining è un processo di analisi dei dati che aziende e titolari di aziende utilizzano per esaminare dati grezzi, inclusi numeri di vendita, prezzi e clienti, per sviluppare migliori strategie di marketing, migliorare le prestazioni o ridurre i costi di gestione del business. Il data mining serve anche a scoprire nuovi modelli di comportamento tra i consumatori.
Una volta che un'azienda analizza i dati rilevanti tramite utilità di gestione dei database come SQL Server di Microsoft o Data Mining Suite di Oracle, applica le informazioni risultanti come un modo per prevedere i fattori futuri correlati all'attività. Ad esempio, i supermercati e i supermercati utilizzano tecniche di data mining per analizzare le informazioni relative a quali consumatori acquistano i prodotti, quanto spendono per tali prodotti e quando sono più propensi a spendere. Quindi, utilizzano le informazioni derivate dal processo per determinare quando offrire sconti e come indirizzare i prodotti a determinati consumatori in base alle loro abitudini di acquisto. I coach di alcune squadre di basket, come i Toronto Raptors, utilizzano il data mining per definire un approccio specifico quando si affrontano squadre diverse.
A partire dal 2015, i due algoritmi più comuni che le aziende utilizzano per analizzare i dati includono la regressione e la classificazione. Il primo sviluppa una formula matematica basata sui dati esistenti, consentendo alle aziende di applicare quella formula a un nuovo set di dati per prevedere in modo efficace il comportamento futuro, ma è utile solo per dati continui, inclusi peso, tempo o velocità. Quest'ultimo è più adatto per dati categoriali, inclusi colori, nomi o genere.