Викия

Наука

Теорема Байеса

22 032статьи на
этой вики
Добавить новую страницу
Обсуждение0 Поделиться

Обнаружено использование расширения AdBlock.


Викия — это свободный ресурс, который существует и развивается за счёт рекламы. Для блокирующих рекламу пользователей мы предоставляем модифицированную версию сайта.

Викия не будет доступна для последующих модификаций. Если вы желаете продолжать работать со страницей, то, пожалуйста, отключите расширение для блокировки рекламы.

Теорема Байеса — одна из основных теорем элементарной теории вероятностей, которая определяет вероятность наступления события в условиях, когда на основе наблюдений известна лишь некоторая частичная информация о событиях; по формуле Байеса можно пересчитывать вероятность, беря в учет как ранее известную информацию, так и данные новых наблюдений.

Математическая формулировкаПравить

\Pr(A|B) = \frac{\Pr(B | A) \Pr(A)}{\Pr(B)},

где

\Pr(A) — априорная вероятность гипотезы A;
\Pr(A|B) — вероятность гипотезы A при наступлении события B (апостериорная вероятность);
\Pr(B|A) — вероятность наступления события B при истинности гипотезы A;
\Pr(B) — вероятность наступления события B.

ПрименениеПравить

Борьба со спамомПравить

Для непосредственного определения вероятности отнесения того или иного сообщения к спаму используются созданные в процессе «обучения» фильтра словари. Т. е. берется полный архив старых, выделенных вручную сообщений и передается на вход программе обучения для дальнейшего анализа. Программа определяет частотные словари для каждого типа сообщений — сколько раз каждое слово появлялось в письмах из данной папки. Когда словари окончательно созданы, вероятность принадлежности нового письма к спаму вычисляется по Байесу для каждого слова из письма. Нормализацией и суммированием вероятностей слов получают общую вероятность принадлежности к спаму для всего письма. Данная система работает с точностью 97—99 %, в процессе дальнейшего обучения точность можно повысить практически до 100 %.

Применение теоремы Байеса позволяет обходиться без формирования «черных списков» почтовых адресов, байесовские фильтры могут самостоятельно опознать «плохое» письмо по его контексту, ненамного уступая в этом умении человеку.

ПрочееПравить

...

См. такжеПравить

Литература Править

СсылкиПравить

Викия-сеть

Случайная вики