Nwlapcug.com


Gli svantaggi del filtraggio dello Spam bayesiano

Gli svantaggi del filtraggio dello Spam bayesiano


Con e-mail arriva lo spam, fastidiose pubblicità inviata non richiesti nella posta in arrivo. Filtri antispam precoce basata su regole, ad esempio "filtrare le e-mail che contengono le parole 'clic'." Ma per ogni regola che potrebbe essere scritta, alcuni spammer intelligente ha trovato un modo intorno ad esso. Ad esempio, gli spammer potrebbero intenzionalmente tralasci parole, ad esempio scrivendo 'c1ick' invece di 'clic', rendendo inutile la regola di filtro. L'aggiunta di filtraggio bayesiano, tuttavia, consentito programmi anti-spam di adattarsi alle mutevoli caratteristiche di spam.

Il filtraggio bayesiano utilizza probabilità

Il filtraggio spam bayesiano adotta un approccio di probabilità. Cataloga parole e altre caratteristiche predefinite di spam e non spam e-mail ricevuta dall'utente. Quando arriva una nuova email, il filtro esegue la scansione per queste parole e caratteristiche. Le parole più che la nuova email ha in comune con parole trovato nel precedente spam, più è probabile che la nuova email saranno contrassegnate come spam dal filtro bayesiano.

Filtri bayesiani imparare e adattarsi

L'approccio bayesiano consente al filtro per "imparare" come le caratteristiche del cambiamento di spam. In un primo momento, potrebbe perdere lo spam che ha l'errata "c1ick", per esempio. Ma come l'utente contrassegna che la posta elettronica come posta indesiderata, il filtro inizierà assegnando una maggiore probabilità che altre email che contengono la parola sono spam.

Formazione necessaria

Il filtraggio bayesiano è molto efficace, ma uno svantaggio è che il filtro deve essere "addestrato". In un primo momento, il database di e-mail è piccolo e l'utente deve continuare contrassegnare la posta in arrivo come "spam" per "addestrare" il filtro. Gli utenti che ricevono un basso volume di email dovrà aspettare a lungo per stabilire un database adeguato.

Bayesian avvelenamento

Un altro svantaggio è che gli spammer continuano a cercare nuovi modi per "avvelenare" o ingannare i filtri di spam come email valido di marcatura. Ad esempio, gli spammer potrebbero includere un blocco di testo normale da un libro o un sito Web nel tentativo di avere un'alta percentuale di "buone" parole nell'email. Per fortuna, questo può essere limitato in efficacia perché il filtro bayesiano definisce "buona e-mail" in modo diverso a seconda del database che si costruisce di email di ogni singolo utente.