Типы распределений и соответствующие им гистограммы

В предыдущей статье нам удалось выделить основные характеристики числового ряда, которые можно показать с помощью гистограмм – это среднее значение популяции, разброс и функция распределения. Так как последняя характеристика зачастую представляет наибольший интерес, ее анализ и примеры некоторых, наиболее часто встречающихся распределений требуют дополнительного внимания.

Гистограмма позволяет анализировать частотное распределение числового ряда, а соответственно дает возможность выделить наиболее вероятные число или диапазон – другими словами, пик. Гистограмма с ярко выраженным пиком называется унимодальной:

Если мы можем различить у гистограммы два ярко выраженных пика, то гистограмма называется бимодальной. Во многих случаях это значит, что выборки происходят из двух разных популяций, так как наличие двух мод в одной популяции маловероятное явление:

Гистограммы с большим количеством пиков (многомодальные) встречаются крайне редко и, зачастую свидетельствуют о присутствии специальных факторов, влияющих на исследуемую систему или процесс. Если каждый интервал гистограммы содержит примерно равное количество значений, то такая гистограмма называется однородной или гистограммой равномерного распределения:

Гистограмма называется симметричной, если она имеет симметричную форму относительно центральной линии (правая и левая стороны одинаковой формы). Ассиметричные гистограммы бывают со скосом влево или вправо от осевой линии. Если левая сторона гистограммы вытянута значительно больше, чем правая (или левый "хвост” значительно длиннее правого), то говорят, что гистограмма имеет отрицательную асимметрию:

Соответственно, у гистограммы с положительной асимметрией больше в сторону выдаётся правая сторона (или правый "хвост” значительно длиннее левого):

Если наблюдаемая величина подчиняется нормальному закону распределения, гистограмма числового ряда будет иметь унимодальную симметрическую форму:

Нормальному закону распределения может подчиняться любая величина, на которую не влияют специальные факторы (например, связывающие или ограничивающие): когда она подвержена влиянию большого числа случайных помех. Считается, что из всех распределений чаще всего встречается именно нормальное.

Частным случаем нормального распределения является логарифмическое распределение. Оно является непрерывным унимодальным распределением и имеет положительную асимметрию. Этому распределению с заданной степенью приближения, подчиняется, например, размер фракций гравия, камня и т.п. Аналогичные примеры: длительность часто повторяемого события (время выполнения операции на конвейере), или размер зарплат на предприятии – как правило, значительно большее количество сотрудников имеет среднюю зарплату, но есть персонал, у которого она значительно выше (правый хвост гистограммы).

Гамма-распределение – это двухпараметрическое семейство абсолютно непрерывных распределений. Они применяются в различных отраслях экономики и техники, теории и практике испытаний надежности. В частности, гамма-распределению могут быть подчинены такие величины, как общий срок службы изделия, время наработки до k-го отказа (k = 1, 2, …, и т.д.). Также, это распределение используется в логистике для описания спроса в моделях управления запасами.

Экспоненциальное распределение – непрерывное распределение, моделирующее время между двумя последовательными свершениями одного и того же события. Например, время между появлениями двух последовательных клиентов (заказчиков в бизнесе или просто покупателей в магазине) будет случайной величиной с экспоненциальным распределением:

Логистическая функция распределения – по форме похожа на функцию нормального распределения, её главное предназначение – моделирование данных бинарного типа. Используется, например, в медико-биологических исследованиях для анализа эффекта различных лекарств, ядов и т.д. От нормального распределения логистическое отличается длинными "хвостами” – данными, находящимися в крайних, отдалённых от центра, позициях:

Вот далеко не полный перечень типов распределений и соответствующих им гистограмм. Внешнее отличие построенной Вами гистограммы от перевернутого колокола еще совсем не означает, что данные собраны неправильно или, что процесс нестабилен. Однако это всегда заставляет исследователя задуматься и постараться найти объяснение такому результату.

23.05.2011 / 38017 / Загрузок: 0 / Andrew /
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2018            Хостинг от uWeb