Tipi di algoritmi di Clustering / Nwlapcug.com

Il clustering è una tecnica di apprendimento della macchina opera raggruppando dati simili. Il clustering è un tipo di apprendimento non supervisionato automatico. L'algoritmo non ha bisogno di essere "addestrato" e possibile raggruppare i dati in gruppi coerenti con fuori un "preconcetto" di ciò che appartiene insieme. Questo differisce dai sistemi di apprendimento supervisionato macchina che devono essere "addestrati" per etichettare i dati correttamente. Clustering è utilizzato principalmente come un meccanismo di riconoscimento del modello di computer.

Generativa o algoritmi basati su probabilità

Generativa o probabilità basato su algoritmi clustering tentano di classificare insiemi di dati come una sorta di distribuzione conosciuta, un raggruppamento di comuni di dati numerici. Questo tipo di algoritmo è utilizzabile solo su dati numerici. Algoritmi generativi vengono con alcuni avvertimenti. Il problema potrebbe essere irrisolvibile se i dati sono consentiti variare troppo liberamente. Algoritmi generativi si supponga inoltre che i dati incarna una nota distribuzione, che non è sempre vera. Questi tipi di algoritmi di non tenere in considerazione "rumore" nei dati.

K-means Clustering

K-means clustering è stato uno dei primi metodi di clustering per essere sviluppato. È semplice da implementare, tuttavia ha lo svantaggio di essere estremamente sensibile ai suoi ingressi di partenza. K-means clustering opere di dividere i dati in un insieme casuale di cluster e quindi ricalcolare i punti medi di ogni cluster e ripetere il processo fino a quando c'è un solo cluster. Questo è noto come convergenza.

Fuzzy Clustering

Anziché identificare dati come appartenenti a gruppi specifici, fuzzy clustering tenta di identificare il grado al quale un punto dati appartiene ad un gruppo. Gli algoritmi utilizzati per fare fuzzy clustering sono conosciuti come "C-means algoritmi." Nell'approccio fuzzy clustering, un punto dati può appartenere a più gruppi. Questo tipo di clustering è utile quando i punti dati potrebbero essere necessario appartenere a più gruppi.

Clustering agglomerativo

Clustering agglomerativo fu uno dei primi algoritmi di clustering per essere sviluppato. Rimane in uso, è anche uno degli algoritmi più semplici sviluppati fino ad oggi. Opere di clustering Agglomerative trattando ogni punto di dati individuali come un cluster e raggruppamento con il punto di dati più simile. Questo processo viene ripetuto fino a quando i dati "converge", o c'è un grande cluster contenente tutti i dati. Il processo può essere fatto anche in senso inverso per lo stesso effetto. A partire da un cluster, tutti i dati possono essere ripetutamente diviso fino a ogni punto dati è un cluster.