Как сравнивать разные массивы данных с помощью гистограмм?

В статье Построение гистограмм в Minitab мы рассмотрели общие принципы построения гистограмм и некоторые тонкости представления данных с их помощью. В этом разделе мы разберем, как сравнить гистограммы двух и более групп данных в Minitab.

Может показаться очевидным, но для того, чтобы сравнивать гистограммы различных групп данных, они должны быть:

  • Перед глазами – вы не сможете сравнивать две гистограммы, перекликивая из одного окна в другой.
  • Представлены в одной системе координат.

Этого можно добиться несколькими путями в Minitab:

  1. Вы можете построить 2 гистограммы и разместить их рядом. Вам также понадобится изменить шкалу по умолчанию (как минимум по оси X), чтобы сравнение было корректным. Как строить простые гистограммы и устанавливать значения шкал, мы рассмотрели выше, поэтому опустим технические детали. Тем более, что этот способ самый трудоемкий и подходит для сравнения максимум 4-х графиков – больше на один экран не влезет.
  2. Вы можете построить простую гистограмму, но автоматизировать все остальные операции. Для этого:
    • В меню Garph выберите Histogram, а затем Simple.
    • В появившемся окне задайте все колонки с наблюдениями, которые собираетесь сравнить, в поле Graph variables (переменные).
    • Затем нажмите кнопку Multiple Graphs (несколько графиков) и выберите опцию Overlaid on the same graph. Это позволит нанести все переменные на один график.
      • Опция по умолчанию – on separate graphs – строит отдельную гистограмму для каждой переменной.
      • Опция in separate panels of the same graph размещает все переменные на одном графике, но выделяет каждой из них в отдельную гистограмму. Получается график из отдельных “плиточек”. Чтобы построенные таки образом гистограммы находились в одной системе координат, не забудьте установить флажки ниже: Same Y (равные значения по оси Y) и Same X, including same bins (равные значения по оси X, включая равные интервалы).

    Этот способ подойдет, когда вам необходимо сравнить данные в разных колонках. Если же несколько массивов данных находятся в одной колонке (а именно в таком виде чаще всего удается получить результаты из базы данных производственной системы), используйте третий вариант.

  3. Вы можете выбрать в меню Graph \ Histogram одну из опций, которые мы не рассматривали до сих пор: With Groups (простая гистограмма для различных групп данных) или With Fit and Groups (гистограмма для различных групп данных с наложенной кривой распределения).
    • Выберем With Groups инажмем Ok.
    • В поле “Graph variables:” необходимо задать столбцы значений, которые мы хотим сравнить.
      • Опция “Graph variables form groups” по умолчанию отмечена флажком. Если вы задали одну колонку переменных, то различий не будет, а вот для двух и более колонок гистограммы будут построены в двух разных окнах.
    • В поле “Categorical variables for grouping (0-3)” указываем колонку или колонки с атрибутами для группирования наблюдений.

    • Нажимаем Ok и получаем две гистограммы:

По умолчанию построенная гистограмма будет состоять из полупрозрачных обрамленных колонок3, цвет которых соответствует отдельному массиву данных. Тем не менее, вид гистограммы можно изменить:

  • Добавить линии аппроксимированных распределений данных и сглаживания: дважды кликните по диаграмме, чтобы открыть окно редактирования; затем кликните правой кнопкой мыши и выберите Add \ Distribution Fit и/или Add \ Smoother. Сами колонки можно удалить с графика.

  • Представить данные не колонками (bars), а символами (symbols), линиями (project lines) или площадью (area): дважды кликните по диаграмме, чтобы открыть окно редактирования; затем кликните правой кнопкой мыши и выберите Add \ Data Display и выберите нужную опцию.

Все остальные настройки и способы кастомизации, специфические для гистограмм и общие для всех графиков в Minitab, также доступны. Этого спектра более чем достаточно для сравнения данных и визуализации ваших выводов. Однако вы должны понимать, что происхождение данных, что они обозначают и цели анализа программе неизвестны. Именно поэтому настройка и оформление гистограмм проводится вручную. Множество дополнительных опций, в том числе изменение цветовых гамм, типов и толщины линий, изменений форм и размеров фигур, являются, безусловно, очень полезными при построении и оформлении гистограмм. Главное – не переусердствовать и всегда сохранять понимание того, что является одним из основных преимуществ гистограмм – простота и доступность понимания как для вас, так и для того, кому вы её представляете.

17.09.2020 / 85 / Загрузок: 0 / DMAgIC /
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2020            Хостинг от uWeb