Май 2020

Две точки зрения на важность определений

Можно управлять только тем, что мы осознаем. То, что мы не осознаем, управляет нами
Приписывают Публию Сиру, римскому поэту, I век до н. э.

Человек мыслит понятиями. Если он не понимает, что подразумевает тот или иной термин, он не способен им воспользоваться. Некоторые понятия мы определяем интуитивно (нам кажется, что мы давно/всегда понимали, о чем речь), про некоторые – узнаем из литературы. Иногда мы читаем о чем-то, казалось бы, знакомом, но понимаем, что новое определение дало нам больше, позволило иначе взглянуть на явление.

Дерево Джошуа

Предыдущая глава      Оглавление      Следующая глава

Подробнее »Две точки зрения на важность определений

Теория информации

Когда я поступил в институт (в конце 1970-х), очень популярной была игра Быки и коровы. Так совпало, что в это время я прочитал математическую новеллу Альфреда Реньи о теории информации. Я узнал, как измерять информацию, как задавать вопросы, чтобы получать максимум информации, и разработал алгоритм, позволявший отгадывать числа в среднем за 5 вопросов.

Зависимость количества информации (энтропии) от вероятности одного из двух событий

Предыдущая глава      Оглавление      Следующая глава

Подробнее »Теория информации

Ложь, наглая ложь и статистика

Выражение «Существуют три вида лжи: ложь, наглая ложь и статистика» получило известность благодаря Марку Твену, который приписал его премьер-министру Великобритании Бенджамину Дизраэли. Я помню, как однажды, работая в издательстве, хотел продемонстрировать сокращение числа ошибок в рекламных объявлениях. Исходные данные выглядели неплохо (левый рисунок), но самое первое значение явно не вписывалось в обнаруженную тенденцию, и я его… просто отбросил. Теперь график вместо колебаний вокруг значения 1,5%, однозначно демонстрировал успехи))

Доля объявлений, вышедших с ошибками: (а) полные данные; (б) после коррекции

Предыдущая глава      Оглавление      Следующая глава

Подробнее »Ложь, наглая ложь и статистика

Распределения с толстыми хвостами

Герой Бена Аффлека в фильме Расплата выполняет аудит компании по производству робототехники. Сотрудница финансового отдела компании обнаружила несоответствие на миллионы долларов. Аффлек анализирует первые цифры счетов, и обнаруживает их неестественность. Злой умысел подтвержден…

Бен Аффлек и Анна Кендрик в фильме Расплата

Предыдущая глава      Оглавление      Следующая глава

Подробнее »Распределения с толстыми хвостами

Практика вероятностей. Байесовский подход

Изучение вероятностей начинается там, где заканчивается классический курс теории вероятностей. В школе и вузе преподают частотную (комбинаторную, априорную) вероятность, или вероятность того, что определено. Эта теория редко находит применение за пределами казино. Человек устроен иначе. Мы имеем теории (мнения) по поводу всего на свете. Мы субъективно оцениваем вероятность тех или иных событий. Мы также можем изменить свое мнение при получении новых сведений. Это то, что мы делаем каждый день. Если вы встречаетесь с подругой у памятника Пушкину, вы понимаете, будет ли она вовремя, опоздает на 15 минут или полчаса. Но выйдя на площадь, и увидев 10 см свежего снега, вы обновите свои вероятности, чтобы учесть новые данные.

 

Новое знание = Исходные посылки + Новые данные

 

Предыдущая глава      Оглавление      Следующая глава

Подробнее »Практика вероятностей. Байесовский подход

Теория вероятностей

Говоря о вероятностях важно различать априорную, эмпирическую и субъективную вероятности. В первом случае вероятность события оценивается на основе теоретической (априорной) частоты. Например, вероятность появления шестерки при бросании кости равна ⅙. Эмпирическая вероятность изучается на опыте. Например, контрольная карта Шухарта позволяет оценить вероятность того, что параметр процесса будет находиться внутри контрольных границ. Субъективная вероятность представляет собой шанс, который приписывается событию человеком. Другой человек может иначе оценивать шансы того же события.

Нормальное распределение: по оси абсцисс – число стандартных отклонений; десятичные числа на диаграмме – вероятность в процентах попадания случайной величины в диапазон

Предыдущая глава      Оглавление      Следующая глава

Подробнее »Теория вероятностей