Представление данных с помощью ящичных диаграмм. Часть 1

Существует множество способов представить числовые данные в графическом виде. И хотя каждый из этих способов имеет свои достоинства и недостатки, все они призваны для одной цели – визуализации массива данных. Вполне логично предположить, что все методы, так или иначе, представляют данные в определенном (не полном) объеме, а потому имеют одинаковую ценность. Тем не менее, от выбора способа представления данных зависит многое: если постараться определить кратко, то насколько удачно Вы сможете подобрать способ графической интерпретации данных – настолько аудитория сможет понять цель того, что Вы пытаетесь показать этим.

Среди наиболее простых, но от этого не менее информативных методов, можно выделить ящичные диаграммы. Основная цель ящичной диаграммы – представить распределение значений. Выгодным достоинством ящичной диаграммы является возможность сравнения нескольких распределений одновременно. С другой стороны внешний вид диаграммы, несмотря на свою незамысловатость, не столь прост в понимании как это может показаться. Представляя данные в виде ящичных диаграмм, следует всегда учитывать уровень знаний аудитории. Текстовые пояснения или краткий экскурс помогут слушателям понять, что отображает диаграмма.

В простейшем случае, ящичная диаграмма отображает значения следующим образом:

В целом, диаграмма состоит из двух частей: "ящика” и "хвостов” или "усов”. Разберем все по порядку: на диаграмме представлен весь диапазон наблюдаемых значений. 50% из них помещены в ящик, остальные 50 – представлены хвостами. Конец нижнего хвоста представляет наименьшее из наблюдаемых значений, конец верхнего – наибольшее. Нижняя стенка ящика (перпендикулярная хвосту) представляет первый квартиль. Соответственно Верхняя стенка ящика (перпендикулярная хвосту) отображает третий квартиль. В центре ящика проходит еще одна линия, перпендикулярная хвостам – это медиана (второй квартиль). Стороны ящика, параллельные хвостам не отображают ничего, кроме целостности ящика, разумеется.

Как было сказано Выше, это наиболее простой способ отображения диаграммы – не перегруженный. Тем не менее, следует отметить потенциальные возможности данного способа графического представления данных. Для этого воспользуемся окном опций (Data View…) в программе Minitab:

Как видим, из всего списка доступных возможностей выбрано только два. В большинстве случаев этого достаточно для анализа: не стоит перегружать диаграмму лишними сведениями – это лишь затруднит ее понимание. С другой стороны, удачно варьируя отмеченными пунктами можно представить данные в новом свете.

Учитывая возможности современных статистических пакетов анализа данных, построение диаграммы не составляет труда. Но с теоретической точки зрения, стоит коротко рассмотреть принципы построения. Попробуем построить диаграмму вручную, используя следующий набор данных: 231, 248, 228, 256, 252, 262, 216, 253, 254, 257, 244, 238.

  1. Ранжируем наблюдаемые значения в порядке возрастания: 216, 228, 231, 238, 244, 248, 252, 253, 254, 256, 257, 262
  2. Определим минимальное и максимальное значения: 216 и 262 соответственно
  3. Определим медиану – 250
  4. Находим первый и третий квартили: 232 и 255
  5. Рисуем шкалу и откладываем на ней значения, найденные в пунктах 2, 3 и 4. Используя значения медианы и квартилей, рисуем ящик. Соединив минимальное значение с первым квартилем и максимальное с третьим линиями, получаем хвосты:

Сравним с диаграммой, построенной в пакете Minitab:

  1. Вносим все данные в одну колонку
  2. В меню Graph выбираем Boxplot
  3. В появившемся окне выбираем One Y / Simple
  4. Определяем колонку наблюдаемых значений и нажимаем Ok

Таким образом, представление данных в виде ящичной диаграммы дает возможность визуально оценить разброс значений и его асимметрию, что выгодно отличает данный вид диаграмм при сравнении двух и больше серий данных от других видов диаграмм.

Представление данных с помощью ящичных диаграмм. Часть 2 >>>

17.01.2010 / 4588 / Загрузок: 0 / DMAgIC /
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2017            Хостинг от uWeb