Псевдонормальные распределения

В статистике и теории вероятностей особое внимание уделяют функции или закону распределения величин. Сведения о законе распределения переменной дают возможность говорить о вероятности появления того или иного его значения, следовательно, делать выводы о генеральной совокупности данных на основании выборочных наблюдений.

Среди различных законов распределения чаще всего приходится сталкиваться с так называемым нормальным законом. Переменная величина, закон распределения которой подчиняется нормальному, симметрично распределена вокруг среднего арифметического значения и попадает в заданные интервалы стандартных отклонений с известной вероятностью:

Говорят, что кривая Гаусса внешне напоминает колокол. Следующий рисунок демонстрирует зависимость внешнего вида кривой нормального распределения от величины стандартного отклонения:

Распределение переменной величины довольно легко оценить визуально, с помощью гистограммы. Кроме того, визуальную оценку распределения проводят с помощью ящичных диаграмм, простых и вероятностных графиков:

Для нормального распределения характерны:

  • близость значений средних (среднего арифметического, медианы и моды)
  • отсутствие асимметрии (Skewness=0 или значение весьма близко)
  • отсутствие эксцесса (Kurtosis=0 или значение весьма близко)
  • “хвосты” ящичной диаграммы имеют равную длину, а “ящик” разделен на две половины медианой
  • график ряда показывает равномерное случайное попадание точек в диапазон вокруг условной центральной линии
  • гистограмма симметрична и имеет один пик (внешняя форма напоминает колокол)
  • точки на вероятностном графике практически не отклоняются от центральной линии.

Если отсутствует влияние специальных факторов, то распределение чаще всего будет подчиняться нормальному закону. В противном случае говорят об определенной доле согласия с тем или иным законом распределения. Обратите внимание: термин “ненормальное” к функциям распределения не применяют.

Термин “псевдонормальное распределение” в теории статистического анализа применяют также редко, а определения термина встречать мне не доводилось. Поэтому в этой и нескольких последующих публикацях предлагаю понимать под термином “псевдонормальное распределение” дословное значение словосочетания: псевдо (греч. ложный) и нормальное распределение – т.е. распределение, которое, вопреки схожести с нормальным, таковым не является.

Один из примеров псевдонормального распределения представлен на следующем рисунке:

Гистограмма внешне весьма схожа с кривой нормального распределения, поэтому побуждает исследователя сделать опрометчивый вывод о подчинении распределения переменной нормальному закону. Однако при более скрупулёзном изучении легко заметить анормальное состояние распределения:

Первая сложность – это подтверждение гипотезы о подчинении распределения переменной нормальному закону. Вопреки внешнему виду гистограммы, точечная диаграмма, график числового ряда и вероятностный график свидетельствуют о накоплении всех значений в “гранулы” – granularity. При увеличении количества интервалов по оси X этот эффект будет заметен и на гистограмме:

Ввиду того, что накопление исключительно определенных значений переменной крайне маловероятно, можно предположить, что вместо непрерывных значений зафиксированы атрибутивные. Следовательно, основной причиной возникновения дискретности – “грануляции” наблюдений является измерительная система.

Наиболее вероятной причиной влияния измерительной системы на дискретность наблюдений является ограничение разрешающей способности. Кроме того, дискретность наблюдений может быть вызвана особенностями измеряемых единиц. Например, распределение такого общего для партии изделий параметра, как вес, будет подвержено дискретности ввиду того, что значения могут отличаться лишь на величину веса отдельной детали. Распределение размера файлов на Вашем компьютере будет подвержено дискретности из-за заранее заданного размера кластеров жесткого диска. Распределение значений двух игральных костей подвержено дискретности: вы можете выкинуть значение от 2 до 12. Получить значение 3,14 просто невозможно.

16.05.2012 / 4666 / Загрузок: 0 / DMAgIC /
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2018            Хостинг от uWeb