Алгоритм Байеса

Bermuda

Новичок
Алгоритм Байеса

Ищу реализацию алгоритма Байеса. Желательно на php, хотя подойдет и любой другой язык. Немного покапался гуглом и яндексом, ничего толкового не нашел, хотя в некоторых местах упоминается. На крайний случай подойдет документация -- реализацию напишу сам и поделюсь, может оформлю в библиотеку.
 

Bermuda

Новичок
Очень даже неплохо. Спасибо! Буду разбираться. Вот если бы еще теорию найти. Как я понял это что-то из области теории вероятности. Я хочу написать скрипт и потом скармливать ему входящие письма чтобы он их сортировал.

Надо будет теорию вероятности покапать, а то спамеры достали уже. По 40 писем спама в день выгребаю, и может быть одно неспамерское. Хоть ты почтой не пользуйся.
 

si

Administrator
Bermuda
полно готовых спам фильтров, зачем изобретать велосипед ?
 

Bermuda

Новичок
Признаюсь честно -- я не сторонник велосипедов и буду бесконечно счатлив если мне подкинут ссылку.

Нужен скрипт удовлетворяющий следующим условиям.

0) Скрипт можно обучать спаму и неспаму скармливая ему соответствующие письма в формате Unix-mailbox.
1) Спам кладется в отдельную папку.
2) Неспам кладется в отдельную папку.
3) Сомнительные письма кладутся в отдельную папку.
4) Письма падают на stdin скрипта и обрабатываются им.

Дело в том, что серваком я рулить не могу, но в свой почтовый каталог могу положить скрипт и изменить конфигурацию своей почты могу.
 

Bermuda

Новичок
Автор оригинала: tony2001
чем, например, bogofilter не подходит?
Есть определенные ограничения...

1. Раньше я пользовался The Bat-ом который имеет отличный Байесовский фильтр, но покупка наладанника принудила к использованию Outlook.

2. Для Outlook есть куча фильтров, но в большинстве своем они платные.

3. Самое главное это то, что я почту проверяю с разных мест (работа, дом, наладонник, телефон), а сообщения на сервере не удаляю чтобы всегда иметь копию в другом месте.
На работе проверяю через web-интерфейс. Одновременно с этим дома включен комп который каждые 5 мин. проверяет почту. Т. е. даже если я удалю спам через web-интерфейс, то скорее всего я не успею это сделать до того, как домашний клиент его получит, и, следовательно, дома придется разгребать спам второй раз.

Идея следующая: при определении спама класть его в другую папку или просто ставить ему какую-нибудь отметку, например: X-SPAM: True или вроде того.

tony2001, почитал про bogofilter. По-моему то, что надо. Спасибо. Ты избавил меня от мук :)

-~{}~ 05.10.05 00:29:

tony2001

Дочитаваю доку по bogofilter. Это полный фарш. Дико рад и бесконечно благодарен. Уж не первый раз выручаешь, спасибо :)
 

Bermuda

Новичок
Да, хочу фильтровать на сервере, потому как почту получаю с разных клиентов и при получении сообщения не удаляю его. Мда-а-а, нужно было вопрос так сразу и формулировать. Лопух я.
 
Сверху