Пусть, на основе анализа 70 писем, слово «приз» встретилось среди шести писем, помеченных как спам, и среди пяти, помеченных как не спам. В других письмах такого слова не было, при этом 24 из них были помечены как спам.
Определите вероятность того, что письмо, попавшее в спам, содержит слово приз.
Используя формулу Байеса, найдите вероятность того, что письмо является спамом, если оно содержит слово приз.
Другие предметы Колледж Вероятностные модели и теорема Байеса машинное обучение колледж обучение в колледже курсы машинного обучения спам фильтры вероятность спама анализ писем байесовская вероятность классификация писем статистика машинного обучения обучение алгоритмам колледж программирование исследование данных Новый
Давайте решим задачу шаг за шагом, используя данные, которые у нас есть. Мы можем использовать теорему Байеса для нахождения искомой вероятности.
Сначала определим все необходимые данные:
Теперь мы можем найти вероятность того, что письмо содержит слово "приз" при условии, что оно является спамом. Обозначим:
Теперь мы можем использовать теорему Байеса для нахождения искомой вероятности:
P(Спам | Приз) = (P(Приз | Спам) * P(Спам)) / P(Приз)
Где P(Приз) можно найти так:
P(Приз) = P(Приз | Спам) * P(Спам) + P(Приз | Не спам) * P(Не спам)
Теперь подставим значения:
Таким образом, вероятность того, что письмо является спамом, если оно содержит слово "приз", равна 35/22.