Nell'analisi statistica, la modalità è l'elemento che si verifica più frequentemente in un gruppo. Se, ad esempio, si sta ordinando un sacchetto di M & Ms di colore, potete trovare che avete 25 rosso, giallo 13, 15 marrone e verde 32 caramelle. La modalità sarebbe verde.
Quando informazioni di data mining da un database SQL, è spesso necessario calcolare dati statistici sulla base delle informazioni è recuperare. SQL non vuole essere una piattaforma robusta per l'analisi statistica, ma con attenzione creando query del database, è possibile eseguire molti calcoli statistici, tra cui la modalità.
Istruzioni
1
Determinare le tabelle di database e i nomi dei campi contenenti i dati grezzi. Per questo esercizio, presumo che ci abbiamo catalogato tutti i membri di una classe di liceo in una tabella denominata "aula", che contiene i campi "nome", "età" e "chiave". Un'uscita dell'intera tabella è simile al seguente:
Tabella: aula
chiave nome età
Steve 7 21
4 Marco 20
5 Jane 20
6 Fred 20
3 Matt 19
1 John 18
2 Maria 18
Vogliamo trovare il modo di età degli studenti.
2
Scrivere una query SQL di base per raccogliere le informazioni di "età". La query sarà simile a questo:
Seleziona età
DA aula
GRUPPO di età
3
Aggiungere la funzione Count () alla query, che conta il numero di volte che un particolare elemento si verifica e i risultati vengono visualizzati in una colonna denominata "frequenza". La query ora dovrebbe assomigliare a questo:
SELECT COUNT (*) frequenza, età
DA aula
GRUPPO di età
4
Aggiungere il comando "Ordina per" l'ultima riga della query. Questo visualizzerà i dati di "frequenza" dal più alto al più basso. La query dovrebbe assomigliare a questo:
SELECT COUNT ( ) frequenza, età
DA aula
GRUPPO di età
ORDINE di conteggio ( ) DESC
5
Inserire "TOP 1" alla query dopo "SELECT". In questo modo, la query completata restituirà solo la prima riga di dati. La query completa dovrebbe assomigliare a questo:
Seleziona frequenza di conteggio TOP 1 ( ), l'età
DA aula
GRUPPO di età
ORDINE di conteggio ( ) DESC
6
Inviare questa query al database. I risultati in base a questo esempio dovrebbero assomigliare a questo:
età di frequenza
3 20
La modalità, in questo caso, è 20.