Program se iz dveh korpusov sporočil (»čista« in neželena sporočila) nauči, katere besede se pojavljajo v neželeni pošti, katere ne, in katere se pojavljajo v obeh vrstah sporočil. Pri preverjanju program iz sporočila izbere 15 'najzanimivejših' besed (tistih, pri katerih je najbolj oz. najmanj verjetno, da se bodo pojavila v neželeni pošti) in iz tega izračuna, kolikšna je verjetnost, da je sporočilo neželeno. Pri večini sporočil je verjetnost nad 0,9 (neželeno) ali pod 0,1 (običajno).