Избранное

Ричард Фейнман. Характер физических... В основу этой книги легли знаменитые лекции Ричарда Фейнмана, прочитанные им в 1964 году в Корнуолльском университете....

Далее

Тони Крилли. Математика. 50 идей,... Всю математику не под силу знать никому, она слишком многообразна, но основные идеи, что определили и определяют...

Далее

Эрик Шпикерманн. О шрифте Шрифт сопровождает нас везде: на упаковках продуктов, вывесках, экранах телевизоров и смартфонов. Но выбрать из...

Далее

Парадокс Кондорсе, теорема Эрроу,... Некоторое время назад прочитал книгу Ричарда Румельта Хорошая стратегия, плохая стратегия. В чем отличие и почему...

Далее

Станислав Улам. Приключения... Это автобиография известного польского математика Станислава Улама. Он родился во Львове в начале XX века. Незадолго...

Далее

Распределение Пуассона

Рубрика: 8. Статистика

Ранее мы рассмотрели два типа дискретных числовых распределений: биномиальное и гипергеометрическое. Во многих практически важных приложениях большую роль играет распределение Пуассона. Многие из числовых дискретных величин являются реализациями пуассоновского процесса, обладающего следующими свойствами:[1]

  • Нас интересует, сколько раз происходит некое событие в заданной области возможных исходов случайного эксперимента. Область возможных исходов может представлять собой интервал времени, отрезок, поверхность и т.п.
  • Вероятность данного события одинакова для всех областей возможных исходов.
  • Количество событий, происходящих в одной области возможных исходов, не зависит от количества событий, происходящих в других областях.
  • Вероятность того, что в одной и той же области возможных исходов данное событие происходит больше одного раза, стремится к нулю по мере уменьшения области возможных исходов.

Далее

Гипергеометрическое распределение

Рубрика: 8. Статистика

Гипергеометрическое распределение, как и биномиальное, позволяет оценить количество успехов в серии из n испытаний. Разница между ними заключается в способе получения исходных данных. В биномиальной модели данные выбираются либо из конечной генеральной совокупности с возвращением либо из бесконечной генеральной совокупности без возвращения. В гипергеометрической модели данные извлекаются только из конечной генеральной совокупности без возвращения. [1] Таким образом, в то время как в биномиальной модели вероятность успеха р остается постоянной, а испытания не зависят друг от друга, в гипергеометрической модели эти условия не выполняются. Наоборот, в гипергеометрической модели каждый исход зависит от предыдущих исходов.

Гипергеометрическое распределение, описывающее вероятность X успехов при заданных параметрах n, N и А:

где Р(Х) — вероятность X успехов при заданных n, N и А, n — объем выборки, N — объем генеральной совокупности, А — количество успешных исходов в генеральной совокупности, N – A — количество неудачных исходов в генеральной совокупности, X — количество успехов в выборке, N – X — количество неудачных исходов в выборке.

Далее

Биноминальное распределение

Рубрика: 8. Статистика

В настоящей и нескольких следующих заметках мы рассмотрим математические модели случайных событий. Математическая модель — это математическое выражение, представляющее случайную величину. Для дискретных случайных величин это математическое выражение известно под названием функция распределения. [1]

Если задача позволяет явно записать математическое выражение, представляющее случайную величину, можно вычислить точную вероятность любого ее значения. В этом случае можно вычислить и перечислить все значения функции распределения. В деловых, социологических и медицинских приложениях встречаются разнообразные распределения случайных величин. Одним из наиболее полезных распределений является биномиальное.

Биномиальное распределение используется для моделирования ситуаций, характеризующихся следующими особенностями.

  • Выборка состоит из фиксированного числа элементов n, представляющих собой исходы некоего испытания.
  • Каждый элемент выборки принадлежит одной из двух взаимоисключающих категорий, исчерпывающих все выборочное пространство. Как правило, эти две категории называют успех и неудача.
  • Вероятность успеха р является постоянной. Следовательно, вероятность неудачи равна 1 – р.
  • Исход (т.е. удача или неудача) любого испытания не зависит от результата другого испытания. Чтобы гарантировать независимость исходов, элементы выборки, как правило, получают с помощью двух разных методов. Каждый элемент выборки случайным образом извлекается из бесконечной генеральной совокупности без возвращения или из конечной генеральной совокупности с возвращением.

Далее

Ковариация и ее применение в финансовом деле

Рубрика: 8. Статистика

В предыдущей заметке мы рассмотрели понятия математического ожидания, дисперсии и стандартного отклонения дискретной случайной величины. В настоящей заметке вводится понятие ковариации между двумя переменными и его применение для управления портфелем активов. Эта задача вызывает большой интерес у финансовых аналитиков. [1]

Ковариация σXY между двумя дискретными случайными величинами X и Y определяется формулой

где Xii-e значение дискретной случайной величины X, Р(Хi) — вероятность i-гo значения дискретной случайной величины X, Yii-e значение дискретной случайной величины Y, Р(Yi) — вероятность i-гo значения дискретной случайной величины Y, Р(ХiYi) — вероятность i-гo значения дискретной случайной величины X и i-гo значения дискретной случайной величины Y, i = 1, 2, … , N.

Далее

Распределение дискретной случайной величины

Рубрика: 8. Статистика

В одной из предыдущих заметок указывалось, что исход испытания может представлять собой числовую переменную. В свою очередь, числовые переменные разделяются на дискретные и непрерывные. Дискретные переменные характерны для перечислений и подсчета, а непрерывные — для измерений. В этой и нескольких последующих заметках будут рассмотрены общие положения и наиболее распространенные распределения, описывающие дискретные случайные величины. [1]

Распределение дискретной случайной величины — это исчерпывающий список всех возможных значений случайной переменной, где каждому исходу поставлена в соответствие его вероятность. Например, на рис. 1 приведено распределение количества ипотечных займов, выданных в течение недели местным филиалом банка. Поскольку в таблице приведены все возможные исходы, сумма их вероятностей равна 1.

Рис. 1. Распределение количества ипотечных займов, выданных за неделю

Далее

Условная вероятность. Теорема Байеса

Рубрика: 8. Статистика

В рассмотренных ранее примерах вычислялись вероятности элементарных событий. Возникает вопрос: как определить вероятность события, если известна некая информация о событиях, происшедших до него? [1] Вероятность события А, при вычислении которой учитывается информация о событии В, называется условной и обозначается как Р(А|В).

Вероятность события А при условии, что наступило событие В, равна вероятности события А и В, деленной на вероятность события В:

Вероятность события В при условии, что наступило событие А, равна вероятности события А и В, деленной на вероятность события А:

где Р(А и В) – вероятность события А и В, Р(А) – вероятность события А, Р(В) – вероятность события В.

Далее

Основные понятия теории вероятностей

Рубрика: 8. Статистика

Предыдущие заметки (см. оглавление) были посвящены методам сбора данных, способам построения таблиц и диаграмм, а также исследованию описательных статистик. В настоящей заметке излагаются основы теории вероятностей, позволяющей распространять результаты, полученные при изучении выборок, на всю генеральную совокупность. [1]

Что означает слово вероятность? Вероятность — это возможность наступления некоторого события. Можно говорить о вероятности того, что из колоды карт будет вынута карта черной масти, что человек предпочтет один продукт другому или что новый продукт, появившийся на рынке, будет пользоваться спросом. В каждом из этих вариантов вероятность является числовой величиной, лежащей в интервале от 0 до 1 включительно. Вероятность события, которое никогда не может произойти (невозможное событие), равна 0, а вероятность события, которое происходит постоянно (достоверное событие), равна 1.

Существует три подхода к предмету теории вероятностей: априорная классическая вероятность, эмпирическая классическая вероятность и субъективная вероятность. В рамках априорного классического подхода вероятность события оценивается на основе априорной информации. В простейшем случае, когда все исходы испытаний равновероятны, их вероятность определяется в соответствии с формулой:

(1) вероятность события = Х / Т,

где X — количество испытаний, в которых произошло событие, Т — общее количество испытаний.

Далее

Ковариация и коэффициент корреляции

Рубрика: 8. Статистика

Ранее была рассмотрена диаграмма разброса, иллюстрирующая распределение двумерных числовых данные (см. последний раздел Изображение двумерных числовых данных заметки Представление числовых данных в виде таблиц и диаграмм). В настоящей заметке мы изучим два количественных показателя, характеризующих силу зависимости между двумя переменными — ковариацию и коэффициент корреляции. [1] Ковариация оценивает силу линейной зависимости между двумя числовыми переменными X и Y. Выборочная ковариация:

Далее

Анализ данных. Пять базовых показателей распределения случайной величины

Рубрика: 8. Статистика

Основные характеристики выборки (среднее значение, разброс и форма распределения) позволяют описать свойства данных и перейти к более глубоким исследованиям. Довольно часто для анализа данных применяется подход, основанный на пятерке базовых показателей и построении точечных и/или блочных диаграмм. [1]

Пятерка базовых показателей, обеспечивающих наиболее точную оценку вида распределения, состоит из следующих характеристик:

  • Минимальное значение – Хmin,
  • Первый квартиль – Q1,
  • Медиана,
  • Третий квартиль – Q3,
  • Максимальное значение – Xmax.

Далее

Определение среднего значения, вариации и формы распределения. Описательные статистики

Рубрика: 8. Статистика

Способы представления числовых и категорийных данных в виде таблиц и диаграмм являются существенной, но не основной частью анализа данных. Ведущая роль принадлежит методам исследования числовых данных и их свойств. В этой заметке рассмотрены способы определения среднего значения, вариации и формы распределения генеральной совокупности. [1]

В большинстве случаев данные концентрируются вокруг некоей центральной точки. Таким образом, чтобы описать любой набор данных, достаточно указать средне значение. Рассмотрим последовательно три числовые характеристики, которые используются для оценки среднего значения распределения: среднее арифметическое, медиана и мода.

Среднее арифметическое

Среднее арифметическое (часто называемое просто средним) — наиболее распространенная оценка среднего значения распределения. Она является результатом деления суммы всех наблюдаемых числовых величин на их количество. Для выборки, состоящей из чисел Х1, Х2, …, Хn, выборочное среднее (обозначаемое символом ) равно = (Х1 + Х2 + … + Хn) / n, или

 

где — выборочное среднее, n — объем выборки, Xi – i-й элемент выборки.

Далее