Nwlapcug.com


Analisi di Data Mining & statistica dei dati utilizzando SQL



Data mining e analisi statistica è possibile utilizzare un processo per scoprire informazioni utilizzabili da grandi quantità di dati. L'ambiente di SQL server fornisce uno spazio integrato in cui creare e utilizzare modelli di data mining. Business Intelligence Development Studio di Microsoft include strumenti e algoritmi per facilitare la creazione di soluzioni per diversi tipi di progetti di data mining.

Tecniche di Data Mining

Tecniche di data mining utilizzano analisi matematica per determinare modelli e tendenze esistenti. Solitamente, questi modelli di dati possono non essere trovati utilizzando i metodi di esplorazione di dati tradizionali, a causa della complessità o grandi quantità di dati coinvolti. Nuovi sviluppi sono sempre all'orizzonte, come ad esempio il Data Mining di SQL Server per il Cloud, con soluzioni di servizi Web online che offrono maggiore portabilità. SQL Server DM con Excel e PowerPivot utilizza il data mining e metodi di analisi statistica all'interno di alcuni dei più popolari strumenti di business di Microsoft.

Modelli e le tendenze dei dati

Data mining e analisi statistica utilizzando SQL è possibile utilizzare informazioni tendenze e modelli per costruire modelli di data mining. Questo processo include domande sui dati, durante la creazione di un modello per rispondere a quelle domande. Modelli possono quindi essere distribuiti in ambienti di lavoro adatto. Utilizzando SQL, tendenze e modelli possono anche essere definite e raccolti come modelli di data mining. Modelli di data mining di dati specifici quindi possono essere assegnati a scenari di business particolare, ad esempio, per l'individuazione dei prodotti più probabili di essere venduti insieme o in un ordine in cui i clienti li aggiungono per carrelli, per la previsione delle vendite e per mailing mirati customer.

Costruzione di modelli di Data Mining

SQL può essere utilizzato per costruire modelli di data mining, utilizzando circa sei passaggi fondamentali. Il processo inizia con la definizione del problema, quindi preparando i dati ed esplorare i dati per costruire i modelli. Gli ultimi passaggi possono includere lo studio e convalida di modelli di dati e infine distribuzione e l'aggiornamento di modelli di data mining. Procedura per l'utilizzo di SQL per costruire modelli di data mining non è necessario effettivamente eseguire in sequenza.

Processo di Data Mining

Il data mining e analisi statistica di processo con SQL è dinamico nella natura. Ad esempio, dopo aver esplorato le informazioni, può essere scoperto che i dati trovati non sono sufficienti per creare modelli di data mining appropriato. Di conseguenza, diventerà necessario per la ricerca di informazioni più rilevanti. Può anche essere prudente costruire diversi modelli da cui partire per sperimentare fino a quando una risposta intuitiva alle superfici di problemi specifici.

Evoluzione del progetto

A volte, gli utenti devono ridefinire il problema viene risolto. Modelli anche potrebbero essere necessario essere aggiornato dopo viene distribuito, come nuovi dati diventano evidenti. Infine, ogni passaggio può richiedere ripetuti sforzi nel tentativo di creare il modello più adatto per ogni progetto di analisi statistica utilizzando SQL e data mining.