Построение гистограмм в Minitab

Большинство пакетов статистической обработки данных, и Minitab тому не исключение, содержат встроенную функцию и алгоритм построения графиков. С их помощью вся процедура превращения числового ряда в гистограмму сводится к нескольким кликам мышью. С другой стороны, упрощение процесса создания диаграмм – не главное достоинство специализированной программы. Что еще может предложить нам программная среда? Рассмотрим ниже.

Для того, чтобы построить гистограмму, программе необходимы данные – результаты наблюдений, желательно выстроенные в столбик с заголовком-названием. В противном случае построенный график будет иметь название, например, “Hystogram of С1” (где С1 – столбик, в котором размещены данные). Согласитесь, не очень-то информативно. К тому же, если построение гистограммы является частью проекта, то с его расширением разобраться, какая именно гистограмма представляет нужные нам результаты, будет всё труднее.

Как внести данные на рабочий лист программы, читайте в заметке “Заносим” данные: 4 способа. В этой публикации особенности внесения данных упущены – будем считать, что данные уже заданы, и перейдем непосредственно к процессу построения гистограммы.

Чтобы построить гистограмму, в меню Graph выберите пункт Histogram. Эта команда откроет окно, которое предложит нам выбрать одну из четырех возможностей:

  • Simple – обычная гистограмма.
  • With Fit – обычная гистограмма с линией распределения вероятностей (по умолчанию программа наложит линию нормального распределения).
  • With Groups – гистограмма различных групп данных.
  • With Fit and Groups – гистограмма различных групп данных с наложенной кривой распределения.

Выглядит следующим образом:

Выделенная по умолчанию иконка – Simple или обычная гистограмма – позволит построить простейшую гистограмму. Нажимаем OK, чтобы перейти в следующее меню:

В поле Graph variables можно указать один или несколько столбцов с данными сразу. Для этого нужно дважды кликнуть на нужный столбик в поле слева или выбрать его одним кликом мыши и нажать Select. Как только название столбика появится в поле Graph variables, мы знаем, что нужные данные были заданы. Теперь, чтобы построить гистограмму, достаточно нажать OK:

При выборе гистограммы с наложением кривой распределения вероятностей – With Fit – получим гистограмму, на которую будет наложена (по умолчанию) кривая нормального распределения. Если нам известно, что закон распределения отличается от нормального, то в окне настройки гистограммы можем задать функцию, с помощью которой следует аппроксимировать результаты наблюдений. Для этого в окне настроек выберите опцию Data View:

В закладке Distribution следующего меню установите флажок напротив Fit Distribution и выберите необходимый вид распределения в появившемся списке:

Программа автоматически аппроксимирует данные (в рассмотренном примере выбрано экспоненциальное распределение):

Мы также можем наложить на гистограмму сглаживающую кривую. Для этого выберите опцию Data View еще раз и в появившемся окне перейдите на закладку Smoother. Установите флажок напротив Lowess – это название алгоритма, который использует программа:

Параметры сглаживания – степень и количество шагов – оставляем по умолчанию: 0.5 и 2 соответственно. Полученная гистограмма выглядит следующим образом:

Варьируя этими значениями (степень сглаживания в пределах от 0 до 1), можно менять плавность, мягкость перепадов, приближённость к данным сглаживающей кривой, в зависимости от наших данных и цели анализа.

На вкладке Data Display окна Histogram: Data View можно выбрать различные, относительно нестандартные, способы представления данных на гистограмме:

Если вместо значения по умолчанию – Bars” (колонки) – установить флажок напротив Symbols (символы), частота появления наблюдений в каждом интервале будет представлена виде точек:

Опция Project lines (линии проекции) – позволяет представить данные в виде штрихов с длиной, соответствующей частоте появления значения (на оси X):

Опция Area (площадь) объединяет все прямоугольники данных, образуя единую площадь под кривой, очерченную контуром:

Обратите внимание, что флажки можно отмечать как по отдельности, так и в любых комбинациях. В таком виде гистограмма менее наглядна и, возможно, на первый взгляд покажется не столь понятной. С другой стороны, использование точек, к примеру, позволяет оценить, насколько точно данные аппроксимированы кривой распределения, а с помощью проекционных линий и обрамленных областей сравнить несколько массивов данных гораздо проще, чем с помощью стандартных “столбчатых” гистограмм.

Кроме стандартных настроек, общих для всех графиков в Minitab (таких как настройка шкалы осей, цветов отдельных элементов графика, линий и границ), следует отметить настройку интервалов – Binning. Эта опция специфична для гистограмм. Чтобы перейти к настройке интервалов, дважды кликните на диаграмму – откроется окно редактирования графика. В нем следует дважды кликнуть либо по самой гистограмме, либо по оси данных (X). В открывшемся окне необходимо перейти на вкладку Binning:

Настройки по умолчанию: Interval Type – Midpoint (значения по оси X будут расположены в центре частотных ячеек); Interval Definition – Automatic (количество интервалов определяется программой). Выбав Cutpoint в поле Interval Type, мы сдвигаем интервалы данных таким образом, что значения по оси X будут лежать в точках состыковки прямоугольников – интервалов данных, а установив флажок напротив Number of intervals в поле Interval Definition, можем задать необходимое количество интервалов для гистограммы.

Сравните: вместо Midpoint выбрана опция Cutpoint, а количество интервалов изменено с 47 по умолчанию до 30:

03.09.2020 / 308 / Загрузок: 0 / DMAgIC /
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2020            Хостинг от uWeb