Условная вероятность. Теорема Байеса

В рассмотренных ранее примерах вычислялись вероятности элементарных событий. Возникает вопрос: как определить вероятность события, если известна некая информация о событиях, происшедших до него? [1] Вероятность события А, при вычислении которой учитывается информация о событии В, называется условной и обозначается как Р(А|В).

Вероятность события А при условии, что наступило событие В, равна вероятности события А и В, деленной на вероятность события В:

Вероятность события В при условии, что наступило событие А, равна вероятности события А и В, деленной на вероятность события А:

где Р(А и В) – вероятность события А и В, Р(А) – вероятность события А, Р(В) – вероятность события В.

Скачать заметку в формате Word или pdf

Фактически формулы (1) и (2) это краткая запись условной вероятности на основе таблицы сопряженности признаков. Вернемся к примеру, рассмотренному в предыдущей заметке (рис. 1). Предположим, что нам стало известно, будто некая семья собирается купить широкоэкранный телевизор. Какова вероятность того, что эта семья действительно купит такой телевизор?

Рис. 1. Поведение покупателей широкоэкранных телевизоров

В данном случае нам необходимо вычислить условную вероятность Р (покупка совершена | покупка планировалась). Поскольку нам известно, что семья планирует покупку, выборочное пространство состоит не из всех 1000 семей, а только из тех, которые планируют покупку широкоэкранного телевизора. Из 250 таких семей 200 действительно купили этот телевизор. Следовательно, вероятность того, что семья действительно купит широкоэкранный телевизор, если она это запланировала, можно вычислить по следующей формуле:

Р (покупка совершена | покупка планировалась) = количество семей, планировавших и купивших широкоэкранный телевизор / количество семей, планировавших купить широкоэкранный телевизор = 200 / 250 = 0,8

Этот же результат дает формула (2):

где событие А заключается в том, что семья планирует покупку широкоформатного телевизора, а событие В — в том, что она его действительно купит. Подставляя в формулу реальные данные, получаем:

Дерево решений

На рис. 1 семьи разделены на четыре категории: планировавшие покупку широкоэкранного телевизора и не планировавшие, а также купившие такой телевизор и не купившие. Аналогичную классификацию можно выполнить с помощью дерева решений (рис. 2). Дерево, изображенное на рис. 2, имеет две ветви, соответствующие семьям, которые планировали приобрести широкоэкранный телевизор, и семьям, которые не делали этого. Каждая из этих ветвей разделяется на две дополнительные ветви, соответствующие семьям, купившим и не купившим широкоэкранный телевизор. Вероятности, записанные на концах двух основных ветвей, являются безусловными вероятностями событий А и А’. Вероятности, записанные на концах четырех дополнительных ветвей, являются условными вероятностями каждой комбинации событий А и В. Условные вероятности вычисляются путем деления совместной вероятности событий на соответствующую безусловную вероятность каждого из них.

Рис. 2. Дерево решений

Например, чтобы вычислить вероятность того, что семья купит широкоэкранный телевизор, если она запланировала сделать это, следует определить вероятность события покупка запланирована и совершена, а затем поделить его на вероятность события покупка запланирована. Перемещаясь по дереву решения, изображенному на рис. 2, получаем следующий (аналогичный предыдущему) ответ:

Статистическая независимость

В примере с покупкой широкоэкранного телевизора вероятность того, что случайно выбранная семья приобрела широкоэкранный телевизор при условии, что она планировала это сделать, равна 200/250 = 0,8. Напомним, что безусловная вероятность того, что случайно выбранная семья приобрела широкоэкранный телевизор, равна 300/1000 = 0,3. Отсюда следует очень важный вывод. Априорная информация о том, что семья планировала покупку, влияет на вероятность самой покупки. Иначе говоря, эти два события зависят друг от друга. В противоположность этому примеру, существуют статистически независимые события, вероятности которых не зависят друг от друга. Статистическая независимость выражается тождеством: Р(А|В) = Р(А), где Р(А|В) — вероятность события А при условии, что произошло событие В, Р(А) — безусловная вероятность события А.

Обратите внимание на то, что события А и В являются статистически независимыми друг от друга тогда и только тогда, когда Р(А|В) = Р(А). Если в таблице сопряженности признаков, имеющей размер 2×2, это условие выполняется хотя бы для одной комбинации событий А и В, оно будет справедливым и для любой другой комбинации. В нашем примере события покупка запланирована и покупка совершена не являются статистически независимыми, поскольку информация об одном событии влияет на вероятность другого.

Рассмотрим пример, в котором показано, как проверить статистическую независимость двух событий. Спросим у 300 семей, купивших широкоформатный телевизор, довольны ли они своей покупкой (рис. 3). Определите, связаны ли между собой степень удовлетворенности покупкой и тип телевизора.

Рис. 3. Данные, характеризующие степень удовлетворенности покупателей широкоэкранных телевизоров

Судя по этим данным,

В то же время,

Р (покупатель удовлетворен) = 240 / 300 = 0,80

Следовательно, вероятность того, что покупатель удовлетворен покупкой, и того, что семья купила HDTV-телевизор, равны между собой, и эти события являются статистически независимыми, поскольку никак не связаны между собой.

Правило умножения вероятностей

Формула для вычисления условной вероятности позволяет определить вероятность совместного события А и В. Разрешив формулу (1)

относительно совместной вероятности Р(А и В), получаем общее, правило умножения вероятностей. Вероятность события А и В равна вероятности события А при условии, что наступило событие В, умноженной на вероятность события В:

(3) Р(А и В) = Р(А|В) * Р(В)

Рассмотрим в качестве примера 80 семей, купивших широкоэкранный HDTV-телевизор (рис. 3). В таблице указано, что 64 семьи удовлетворены покупкой и 16 — нет. Предположим, что среди них случайным образом выбираются две семьи. Определите вероятность, что оба покупателя окажутся довольными. Используя формулу (3), получаем:

Р(А и В) = Р(А|В) * Р(В)

где событие А заключается в том, что вторая семья удовлетворена своей покупкой, а событие В — в том, что первая семья удовлетворена своей покупкой. Вероятность того, что первая семья удовлетворена своей покупкой, равна 64/80. Однако вероятность того, что вторая семья также удовлетворена своей покупкой, зависит от ответа первой семьи. Если первая семья после опроса не возвращается в выборку (выбор без возвращения), количество респондентов снижается до 79. Если первая семья оказалась удовлетворенной своей покупкой, вероятность того, что вторая семья также будет довольна, равна 63/79, поскольку в выборке осталось только 63 семьи, удовлетворенные своим приобретением. Таким образом, подставляя в формулу (3) конкретные данные, получим следующий ответ:

Р(А и В) = (63/79)(64/80) = 0,638.

Следовательно, вероятность того, что обе семьи довольны своими покупками, равна 63,8%.

Предположим, что после опроса первая семья возвращается в выборку. Определите вероятность того, что обе семьи окажутся довольными своей покупкой. В этом случае вероятности того, что обе семьи удовлетворены своей покупкой одинаковы, и равны 64/80. Следовательно, Р(А и В) = (64/80)(64/80) = 0,64. Таким образом, вероятность того, что обе семьи довольны своими покупками, равна 64,0%. Этот пример показывает, что выбор второй семьи не зависит от выбора первой. Таким образом, заменяя в формуле (3) условную вероятность Р(А|В) вероятностью Р(А), мы получаем формулу умножения вероятностей независимых событий.

Правило умножения вероятностей независимых событий. Если события А и В являются статистически независимыми, вероятность события А и В равна вероятности события А, умноженной на вероятность события В.

(4) Р(А и В) = Р(А)Р(В)

Если это правило выполняется для событий А и В, значит, они являются статистически независимыми. Таким образом, существуют два способа определить статистическую независимость двух событий:

События А и В являются статистически независимыми друг от друга тогда и только тогда, когда Р(А|В) = Р(А).
События А и B являются статистически независимыми друг от друга тогда и только тогда, когда Р(А и В) = Р(А)Р(В).

Если в таблице сопряженности признаков, имеющей размер 2×2, одно из этих условий выполняется хотя бы для одной комбинации событий А и B, оно будет справедливым и для любой другой комбинации.

Безусловная вероятность элементарного события

(5) Р(А) = P(A|B₁)Р(B₁) + P(A|B₂)Р(B₂) + … + P(A|B_k)Р(B_k)

где события B₁, B₂, … B_k являются взаимоисключающими и исчерпывающими.

Проиллюстрируем применение этой формулы на примере рис.1. Используя формулу (5), получаем:

Р(А) = P(A|B₁)Р(B₁) + P(A|B₂)Р(B₂)

где Р(А) — вероятность того, что покупка планировалась, Р(В₁) — вероятность того, что покупка совершена, Р(В₂) — вероятность того, что покупка не совершена.

ТЕОРЕМА БАЙЕСА

Условная вероятность события учитывает информацию о том, что произошло некое другое событие. Этот подход можно использовать как для уточнения вероятности с учетом вновь поступившей информации, так и для вычисления вероятности, что наблюдаемый эффект является следствием некоей конкретной причины. Процедура уточнения этих вероятностей называется теоремой Байеса. Впервые она была разработана Томасом Байесом в 18 веке.

Предположим, что компания, упомянутая выше, исследует рынок сбыта новой модели телевизора. В прошлом 40% телевизоров, созданных компанией, пользовались успехом, а 60% моделей признания не получили. Прежде чем объявить о выпуске новой модели, специалисты по маркетингу тщательно исследуют рынок и фиксируют спрос. В прошлом успех 80% моделей, получивших признание, прогнозировался заранее, в то же время 30% благоприятных прогнозов оказались неверными. Для новой модели отдел маркетинга дал благоприятный прогноз. Какова вероятность того, что новая модель телевизора будет пользоваться спросом?

Теорему Байеса можно вывести из определений условной вероятности (1) и (2). Чтобы вычислить вероятность Р(В|А), возьмем формулу (2):

и подставим вместо Р(А и В) значение из формулы (3):

Р(А и В) = Р(А|В) * Р(В)

Получим:

Подставляя вместо Р(А) формулу (5), получаем теорему Байеса:

где события B₁, В₂, … В_k являются взаимоисключающими и исчерпывающими.

Введем следующие обозначения: событие S — телевизор пользуется спросом, событие S’ — телевизор не пользуется спросом, событие F — благоприятный прогноз, событие F’ — неблагоприятный прогноз. Допустим, что P(S) = 0,4, P(S’) = 0,6, P(F|S) = 0,8, P(F|S’) = 0,3. Применяя теорему Байеса получаем:

Вероятность спроса на новую модель телевизора при условии благоприятного прогноза равна 0,64. Таким образом, вероятность отсутствия спроса при условии благоприятного прогноза равна 1–0,64=0,36. Процесс вычислений представлен на рис. 4.

Рис. 4. (а) Вычисления по формуле Байеса для оценки вероятности спроса телевизоров; (б) Дерево решения при исследовании спроса на новую модель телевизора

Рассмотрим пример применения теоремы Байеса для медицинской диагностики. Вероятность того, что человек страдает от определенного заболевания, равна 0,03. Медицинский тест позволяет проверить, так ли это. Если человек действительно болен, вероятность точного диагноза (утверждающего, что человек болен, когда он действительно болен) равна 0,9. Если человек здоров, вероятность ложноположительного диагноза (утверждающего, что человек болен, когда он здоров) равна 0,02. Допустим, что медицинский тест дал положительный результат. Какова вероятность того, что человек действительно болен? Какова вероятность точного диагноза?

Введем следующие обозначения: событие D — человек болен, событие D’ — человек здоров, событие Т — диагноз положительный, событие Т’ — диагноз отрицательный. Из условия задачи следует, что Р(D) = 0,03, P(D’) = 0,97, Р(T|D) = 0,90, P(T|D’) = 0,02. Применяя формулу (6), получаем:

Вероятность того, что при положительном диагнозе человек действительно болен, равна 0,582 (см. также рис. 5). Обратите внимание на то, что знаменатель формулы Байеса равен вероятности положительного диагноза, т.е. 0,0464.

Рис. 5. (а) Вычисления по формуле Байеса для оценки точности медицинского диагноза; (б) Дерево решения при оценке точности медицинского диагноза

Предыдущая заметка Основные понятия теории вероятностей

Следующая заметка Распределение дискретной случайной величины

К оглавлению Статистика для менеджеров с использованием Microsoft Excel

Возможно, вас также заинтересует:

Дуглас Хаббард. Как измерить всё, что угодно. Оценка стоимости нематериального в бизнесе

Леонард Млодинов. (Не)совершенная случайность. Как случай управляет нашей жизнью

Канеман, Словик, Тверски. Принятие решений в неопределенности: Правила и предубеждения

[1] Используются материалы книги Левин и др. Статистика для менеджеров. – М.: Вильямс, 2004. – с. 265–279

5 комментариев для “Условная вероятность. Теорема Байеса”

Екатерина 26.05.2018 в 15:47

А почему в формуле вероятности покупки телевизора (200/1000)/(250/1000) мы используем полную выборку 1000 семей? Мы же решили, что рассматриваем только 250 человек, а не всех. Тогда просто 200/250 (как расписано было до формулы).
Baguzin 27.05.2018 в 18:49

Екатерина, обратите внимание на фразу:

Р (покупка совершена | покупка планировалась) = количество семей, планировавших и купивших широкоэкранный телевизор / количество семей, планировавших купить широкоэкранный телевизор = 200 / 250 = 0,8

Она четко определяет, что на что делить.
Далее говорится, что тот же результат можно получить с помощью формулы (2), где в числителе вероятность одновременного наступления событий А и В, т.е., вероятность спланировать и купить телевизор (200/1000), а в знаменателе вероятность события А, заключающегося в том, что покупка лишь спланирована (250/1000). Поэтому, именно эти вероятности и подставляются в формулу.
Евгений 09.03.2021 в 03:28

К сожалению, от меня так же ускользает разница между этими формулироваками, ведь сказано то же самое, а цифры разные ?
Евгений 09.03.2021 в 03:30

«В прошлом успех 80% моделей, получивших признание, прогнозировался заранее, в то же время 30% благоприятных прогнозов оказались неверными.»

Могли бы вы уточнить, то есть дается прогноз по всем моделям (100% — все прогнозы, 100% — все модели). И в 30% случаев прогноз был ошибочен, а в 80% — верен?

Но тогда всего было 110%? Как это может быть?
Сергей Багузин 15.03.2021 в 21:52

Евгений, эти вероятности нельзя складывать. Они имеют различный базис. Обратите внимание на текст: «В прошлом успех 80% моделей, получивших признание, прогнозировался заранее…» Здесь базис — фактические итоги продаж: успех или неудача. Для 80% таких моделей прогноз был положительным, а для 20% прогноз был негативным. Вторая часть фразы «…в то же время 30% благоприятных прогнозов оказались неверными» А здесь базис — все прогнозы. 70% хороших прогнозов оправдались в последующих продажах, а 30% позитивных прогнозов привели к провальным продажам.

Условная вероятность. Теорема Байеса

5 комментариев для “Условная вероятность. Теорема Байеса”

Добавить комментарий