ESEMPIO
Concreto sul filtraggio Bayesiano
Supponiamo che il programma filtra l’ e-mail che contengono
parole che generano una percentuale pari o superiore al 100%
(aggressività del filtro: Normale). Associamo alla parola
Sex
la probabilità del 100% di essere Spam, alla parola
Newsletter
30%, alla parola
Unsubscribe
70%. In un primo caso si riceve una mail con la parola
Sex
e Unsubscribe
con la probabilità Totale del 170% e in questa situazione
l’e-mail viene giustamente filtrata. Se si riceve una e-mail del
nostro produttore di antivirus che ci segnala un aggiornamento e
nel corpo del messaggio sono presenti le parole
Newsletter
e Unsubscribe
l’e-mail viene cestinata perché la probabilità è del 100%. In
questa situazione l’utente deve segnalare l’errore al programma.
Da questo errore le percentuali associate alle parole cambiano e
la loro somma diventa minore del 100% e in futuro una simile
e-mail non verrà cestinata. Questo è un esempio molto semplice
ma sono presenti altri criteri di valutazione su tutta l’analisi
a partire dall’intestazione completa del messaggio. Quello che
si è voluto mettere in evidenza come la probabilità associata
alla singola parola può variare in base alle scelte dell’utente.
Da questa analisi si comprende che il filtro
bayesiano
può essere personalizzato. Il fatto che una e-mail sia Spam o
meno può variare da utente a utente. Con questa tecnica il
filtro “Apprende” cosa è effettivamente Spam per l’utente. Per
ottenere buoni risultati l’utente deve essere capace di istruire
correttamente il programma
NON
cambiando linea di condotta su cosa è Spam e su cosa non lo è.
In conclusione l’approccio statistico allo Spamming sembra
l’arma definitiva per combattere la posta indesiderata e risulta
evidente che la scelta deve ricadere su un programma che dispone
del filtraggio bayesiano.
| |
|
AntiSpam Aziendale Consigliato con
filtro Bayesiano |
|
|
|
|
|
|
|
| |
|
|