Перейти к содержимому

8. Статистика

Онлайн калькулятор статистической мощности G*Power

Недавно прочитал книгу Майкла Херцога с соавторами Статистика и планирование эксперимента для непосвященных. В ней я в очередной раз встретился со статистической мощностью. До сих пор я относился к этой статистике несколько академически. Что называется, не чувствовал её на кончиках пальцев. Некоторые разделы книги Херцога меня заинтересовали, я построил пару моделей в Excel и осознал, что статистическая мощность – это вероятность получить в эксперименте статистически значимые результаты. Кроме того, я нашел формулу расчета статистической мощности в Excel. Свои выводы я представил в заметке Статистическая мощность эксперимента в Excel. В книге Майкл Херцог также упоминает о калькуляторе статистической мощности G*Power. Предлагаю вам краткий обзор программы G*Power основанный на переводе статьи Susanne Mayr, Edgar Erdfelder, Axel Buchner, Franz Faul. A short tutorial of GPower, опубликованной в журнале Tutorials in Quantitative Methods for Psychology. – 2007, Vol. 3(2), p. 51–59.

Рис. 1. Анализ статистической мощности в GPower: апостериорный t-тест для независимых выборок

Подробнее »Онлайн калькулятор статистической мощности G*Power

Статистическая мощность эксперимента в Excel

Недавно прочитал книгу Майкла Херцога с соавторами Статистика и планирование эксперимента для непосвященных. В ней я в очередной раз встретился со статистической мощностью. До сих пор я относился к этой статистике несколько академически. Что называется, не чувствовал её на кончиках пальцев. Некоторые разделы книги Херцога меня заинтересовали, я построил пару моделей в Excel, и до меня дошла суть статистической мощности. Я понял, что статистическая мощность – вероятность получить в эксперименте статистически значимые результаты. Кроме того, я нашел формулу расчета статистической мощности в Excel.

Рис. 1. Нормально распределенные случайные величины. Выборка 1 – N(0;1), Выборка 2 – N(1;1)

Подробнее »Статистическая мощность эксперимента в Excel

Статистический вывод на основе критерия Колмогорова

Эта заметка родилась на стыке трех моих увлечений: футбол, Excel и статистика)) Известно, что число голов, забитых каждой командой в одном матче подчиняется распределению Пуассона. Я решил проверить это на результатах матчей английской премьер-лиги сезона 2021/2022. Всего было 38 туров по 10 матчей в туре, по две команды в одном матче. Итого 760 исходных значений.

Рис. 1. Распределение числа забитых голов

Скачать заметку в формате Word или pdf, примеры в формате ExcelПодробнее »Статистический вывод на основе критерия Колмогорова

Стандартное отклонение и стандартная ошибка

Я читаю курс статистического мышления магистрам, и одна тема вызывает у них явные затруднения – чем стандартное отклонение отличается от стандартной ошибки, и в каких случаях, применять ту или иную статистику. А недавно в книге Искусство статистики Дэвида Шпигельхалтера я узнал про бутстрэппинг, и понял, как объяснить различия стандартного отклонения и стандартной ошибки.

Для начала зададим 100 значений стандартной нормально распределенной случайной величины. В этом контексте стандартная означает, что ее матожидание μ = 0, а среднеквадратичное отклонение σ = 1. Поскольку значения в Excel получены с помощью волатильной функции СЛМАССИВ(), после любого действия они пересчитываются. Поэтому диаграммы в заметке и в файле будут отличаться.

Рис. 1. Нормально распределенная случайная величина

Подробнее »Стандартное отклонение и стандартная ошибка

Нетривиальный Байес

Недавно прочитал Искусство статистики Дэвида Шпигельхалтера. На тему байесовской вероятности очень понравился пример с монетами. Сначала – фрагмент книги, а затем небольшая модель в Excel.

У вас в кармане три монеты: на одной два орла, на другой две решки, третья обычная. Вы наугад вытаскиваете монету, подбрасываете ее, и выпадает орел. Какова вероятность, что на другой стороне монеты тоже орел? Дайте свой ответ, прежде чем читать далее.

Рис. 1. Три монеты

Подробнее »Нетривиальный Байес

Центральная предельная теорема

Я часто сталкиваюсь с ситуацией, когда интересные научные концепции не используются на практике из-за сложности их представления. Одним из таких понятий является Центральная предельная теорема. Вот, что сказано в Википедии:

Центральные предельные теоремы – класс теорем в теории вероятностей, утверждающих, что сумма достаточно большого количества слабо зависимых случайных величин, имеющих примерно одинаковые масштабы (ни одно из слагаемых не доминирует, не вносит в сумму определяющего вклада), имеет распределение, близкое к нормальному.

Звучит абстрактно… по крайней мере для меня. Переформулирую:

Центральная предельная теорема: независимо от формы распределения случайной величины средние выборок достаточного размера распределены нормально.

Если и эта формулировка мало что вам прояснила, не отчаивайтесь, изучите два примера.

Рис. 1. Равномерное распределение случайной величины и распределение средних значений выборок разного размера

Подробнее »Центральная предельная теорема

Эксцесс распределения случайной величины

Я подписан на рассылку издательства ДМК Пресс. Оно специализируется на литературе по программированию, но не только. Меня, в частности, интересует статистика. И книг по этой теме в издательстве немало. В недавней рассылке была анонсирована книга японских авторов Статистика в рисунках. Просматриваю оглавление и обнаруживаю раздел Форма распределения. Асимметрия и куртозис. Как же так – использовать куртозис вместо общеупотребимого русскоязычного термина эксцесс!? Гуглю, и второй ссылкой в выдаче появляется Википедия со статьей Коэффициент эксцесса. А первой – ссылка на работу Александра Цыплакова.[1] Читаю и понимаю, что не всё так однозначно))

Рис. 1. Некоторые распределения и их эксцесс: а) эталонное нормальное распределение, эксцесс = 0, б) t-распределение Стьюдента, df = 5, эксцесс > 0, в) равномерное распределение, эксцесс < 0

Подробнее »Эксцесс распределения случайной величины

Каковы шансы поймать нечестную монету?

Возможно, вы слышали про парадокс дней рождения. Ответьте на вопрос: сколько человек должно быть в группе, чтобы вероятность совпадения дней рождения (число и месяц) хотя бы у двух людей превысила 50%? Прежде чем читать далее, дайте быстрый приблизительный ответ.

Подробнее »Каковы шансы поймать нечестную монету?

Статистические симуляции в Excel

Эта продолжение перевода книги Джерарда Вершурена. 100 симуляций в Excel

Предыдущий раздел      К содержанию       Следующий раздел

Глава 9. Честная монета

Что делает симуляция. Имитирует шестикратное подбрасывание монеты. В диапазоне С2:F8 подсчитывается теоретическая вероятность выпадения нуля решек, одной решки, и т.д. Подсчеты делаются для честной монеты с вероятностью выпадения решки в одном броске = 50%, и для нечестных монет, с вероятностью выпадения решки при однократном бросании = 20%, 30%, 40%. График для честной монеты представляет собой колоколообразную кривую. Максимум приходится на 3 решки и его теоретическая вероятность составляет 31% (ячейка F5). Для нечестных монет графики плотности вероятности имеют положительную асимметрию: пик сдвинут влево, а правый хвост более длинный, чем левый.

Рис. 2.1. Является ли монет честной? Чтобы увеличить изображение кликните на нем правой кнопкой мыши и выберите Открыть картинку в новой вкладке

Подробнее »Статистические симуляции в Excel

SPSS Statistics быстрый старт

Основным инструментом анализа и визуализации статистических данных для меня всегда был Excel. Я работаю с ним ежедневно. По нему написал больше всего заметок и прочитал наибольшее число книг. Пожалуй, лучшее сочетание статистики и Excel я нашел в книге Левин. Статистика для менеджеров с использованием Microsoft Excel. Вторым инструментом, к которому я только прикоснулся, был R (см., например, Алексей Шипунов. Наглядная статистика. Используем R!). А недавно прочитал любопытную книгу Нил Дж. Салкинд. Статистика для тех, кто (думает, что) ненавидит статистику. В ней автор все примеры иллюстрирует в программе SPSS. Так что я решил попробовать и этот продукт.

На сайте IBM доступна пробная версия, которая будет работать на вашем ПК 14 дней. Регистрируетесь и скачиваете программу SPSS Statistics. При регистрации запомните пароль. Он вам пригодится для входа в программу. После запуска появляется приветственное окно:

Рис. 1. Приветственное окно SPSS; чтобы увеличить изображение кликните на нем правой кнопкой мыши и выберите Открыть картинку в новой вкладке

Подробнее »SPSS Statistics быстрый старт