Нормальное распределение. Построение графика в Excel. Концепция шести сигм

Рубрика: 3. Логистика, 7. Полезняшки Excel

Наверное, не все знают, что в Excel есть встроенная функция для построения нормального распределения. Графики нормального распределения часто используются для демонстрации идей статистической обработки данных.

Функция НОРМРАСП имеет следующий синтаксис:

НОРМРАСП (Х; среднее; стандартное_откл; интегральная)

Х — аргумент функции; фактически НОРМРАСП можно трактовать как y=f(x); при этом функция возвращает вероятность реализации события Х

Среднее (µ) — среднее арифметическое распределения; чем дальше Х от среднего, тем ниже вероятность реализации такого события

Стандартное_откл (σ) — стандартное отклонение распределения; мера кучности; чем меньше σ, тем выше вероятность у тех Х, которые расположены ближе к среднему

Интегральная — логическое значение, определяющее форму функции. Если «интегральная» имеет значение ИСТИНА, функция НОРМРАСП возвращает интегральную функцию распределения, тот есть суммарную вероятность всех событий для аргументов от -∞ до Х; если «интегральная» имеет значение ЛОЖЬ, возвращается вероятность реализации события Х, точнее говоря, вероятность событий находящихся в некотором диапазоне вокруг Х

Например, для µ=0 имеем:

Скачать заметку в формате Word, пример в формате Excel

Здесь по оси абсцисс единица измерения – σ, или (что то же самое), можно сказать, что график построен для σ = 1. То есть, «-2» на графике означает -2σ. По оси ординат шкала убрана умышленно, так как она лишена смысла. Точнее говоря, высота кривой зависит от плотности точек на оси абсцисс, по которым мы строим график. Например, если на интервал от 0 до 1σ приходится 10 точек, то высота в максимуме составит 4%, а если 20 точек – 2%. Здесь проценты означают вероятность попадания случайной величины в узкий диапазон окрестности точки на оси абсцисс. Зато имеет смысл площадь под кривой на определенном интервале. И эта площадь не зависит от плотности точек. Так, например, площадь под кривой на интервале от 0 до 1σ составляет 34,13%. Это значение можно интерпретировать следующим образом: с вероятностью 68,26% случайная величина Х попадет в диапазон µ ± σ.

Теперь, наверное, вам будет лучше понятен смысл выражения «качество шести сигм». Оно означает, что производство налажено таким образом, что случайная величина Х (например, диаметр вала) находясь в диапазон µ ± 6σ, всё еще удовлетворяет техническим условиям (допускам). Это достигается за счет значительного уменьшения сигмы, то есть случайная величина Х очень близка к нормативному значению µ. На графике ниже представлено три ситуации, когда границы допуска остаются неизменными, а благодаря повышению качества (уменьшению вариабельности, сужению сигма) доля брака сокращается:

На первом рисунке только 1,5σ попадают в границы допуска, то есть только 86,6% деталей являются годными. На втором рисунке уже 3σ попадают в границы допуска, то есть 99,75% являются годными. Но всё еще 25 деталей из каждых 10 000 произведенных являются браком. На третьем рисунке целых 6σ попадают в границы допуска, то есть в брак попадут только две детали на миллиард изготовленных!

Вообще-то говоря, измерение качества в терминах сигм использует не совсем нормальное распределение. 🙂 Вот что пишет на эту тему Википедия:

Опыт показывает, что показатели процессов имеют тенденцию изменяться с течением времени. В результате со временем в промежуток между границами поля допуска будет входить меньше, чем было установлено первоначально. Опытным путём было установлено, что изменение параметров во времени можно учесть с помощью смещения в 1,5 сигма. Другими словами, с течением времени длина промежутка между границами поля допуска под кривой нормального распределения уменьшается до 4,5 сигма вследствие того, что среднее процесса с течением времени смещается и/или среднеквадратическое отклонение увеличивается.

Широко распространённое представление о «процессе шесть сигма» заключается в том, что такой процесс позволяет получить уровень качества 3,4 дефектных единиц на миллион готовых изделий при условии, что длина под кривой слева или справа от среднего будет соответствовать 4,5 сигма (без учёта левого или правого конца кривой за границей поля допуска). Таким образом, уровень качества 3,4 дефектных единиц на миллион готовых изделий соответствует длине промежутка 4,5 сигма, получаемых разницей между 6 сигма и сдвигом в 1,5 сигма, которое было введено, чтобы учесть изменение показателей с течением времени. Такая поправка создана для того, чтобы предупредить неправильною оценку уровня дефектности, встречающееся в реальных условиях.

С моей точки зрения, не вполне внятное объяснение. Тем не менее, во всем мире принята следующая таблица соответствия числа дефектов и уровня качества в сигмах:

Число сигм Число дефектов на миллион измерений Процент дефектов (несоответствий) Уровень качества
3,4 0,00034% идеал
233 0,023% мировой уровень
6210 0,62% приемлемый уровень
66 807 6,68% недостаточный уровень
308 537 30,9% неприемлемый уровень
691 462 69,1%

Для сравнения приведу таблицу для нормального распределения:

Сигма окрестность среднего значения Число случаев на миллион за пределами сигма окрестности Процент случаев за пределами сигма окрестности
0,002 0,0000002%
0,6 0,00006%
63 0,01%
2 700 0,27%
45 500 4,6%
317 311 31,7%

Комментарии: 9 комментариев

Спасибо Вам огромное!!!!! Ваша статья буквально спасла меня)

Спасибо! Никак не мог понять шутку про шесть сигм.
Если честно, сигмы есть у любого распределения. Нужно еще доказать, что процесс (система качества) генерирует именно нормальное, а не биномиальное или др. Различие вероятности брака может составлять тысячи %. Но если не рассматривать мелочи (технические, социальные, психологические) можно «грузить баржу»!? Как раз сегодня Дженерал моторс отзывает 40 тыс. авто, наверное изготовленных по шесть сигм.

Неверный выбор технологического решения изготовления узла автомобиля не может автоматически дискредитировать метод контроля качества изготовления этого узла.

«Шесть сигма» — это для тех, которые за уши притягивают законы ТВМС

ТВМС — теория вероятностей и математическая статистика…
Лилия, отчасти согласен с Вами… «Шесть сигм» — бренд, далекий от ТВМС, преследующий вполне утилитарную цель — заразить идеями совершенствования рабочие массы… Тем не менее, если ознакомиться с серьезными источниками по теме, то в них содержится весьма качественная математика…

«ТВМС — теория вероятностей… » — совершенно верно. Это теория- основа. А «6 сигм» — это метод основанный на этой теории. Прикладное решение для конкретной сферы применения. а вовсе не «бренд». И да, в «6 сигмах» качественная математика именно потому, что стоит на теории ТВМС.
Я заметила на форумах, что молодежь у нас, касается ли это «6 сигм», «agile», «lean manufacturing» или «теории ограничений», все время спорит, что из чего выросло. Т.е. не способна до сих пор четко понимать разницу между теорией и методом.
Спасибо за статью. Напомнила о важном.

Сигма из «шести сигм» и сигма — как стандартное отклонения распределения — это не одно и тоже.

Если не ввязываться в очередную кампанейщину «импортозамещения», то под функцией НОРМРАСП (Х; среднее; стандартное_откл; интегральная) следует подразумевать функцию NORMDIST(x;mean;standard_dev;cumulative).

Огромное спасибо! Целый день промучался. Вы спасли буквально.


Прокомментировать