Представление данных с помощью ящичных диаграмм. Часть 2

В первой части статьи упоминалось, что ящичная диаграмма наиболее часто применяется для сравнения нескольких наборов наблюдаемых значений. Рассмотрим возможность представления значений двух выборок (Рис. 1). С помощью Minitab 16 сгенерируем два набора нормально распределенных данных, по 50 значений в каждом:

  1. среднее значение 25, стандартное отклонение 2
  2. среднее значение 26, стандартное отклонение 3

Рис. 1

Диаграмма дает возможность легко представить два набора данных и проанализировать их. На диаграмме четко видно, что значения выборки C1 имеют меньший разброс, чем в C2. Также четко видно, что медиана C2 имеет большее числовое значение. Что же касается C1, то можно заметить, что значения выборки распределены менее симметрично.

Перед продолжением статьи, предлагаю отдельно остановиться на представлении выводов, сделанных в предыдущем абзаце: разный разброс, значение медиан и асимметрия разброса значений. Постараемся применить несколько опций для того чтобы подчеркнуть эти выводы. Окно опций (Data View) содержит следующие возможности (Рис. 2):

Рис. 2

Для того чтобы более наглядно представить разницу в разбросе значений, можно воспользоваться опцией Range Box в окне Data View. В результате вся диаграмма помещается в еще один ящик (Рис. 3), что приводит к сравнению размеров ящиков вместо диаграмм, соответственно разницу видно более наглядно.

Рис. 3

Чтобы подчеркнуть разность значений медиан, воспользуемся опцией Median connect line – это даст возможность сравнивать медианы не относительно шкалы или положения на диаграмме, а относительно соединительной линии (Рис. 4). Наклон линии подчеркивает разность значений медиан.

Рис. 4

Чтобы выделить асимметричность разброса данных (если самих хвостов не достаточно), можно воспользоваться следующими опциями:

  • Median confidence interval box – ограничитель области доверительного интервала медианы (Рис. 5)
  • Individual symbols – отобразить все наблюдаемые значения на диаграмме. Пользуясь этой возможностью можно указать скопления значений, но также следует учитывать, что использование этой опции очень сильно "утяжеляет” диаграмму.

Рис. 5

Нас следующем рисунке (Рис. 6) представлены результаты измерений деталей, изготовленных разными формообразующими пресс-форм А и В. Также добавлены символы и соединительная линия для средних арифметических значений каждой серии данных.

Рис. 6

На диаграмме однозначно видно, что детали, производимые пресс-формой B, в среднем имеют меньший размер, чем детали, производимые пресс-формой А. Но будьте осторожны: визуальное различие не означает, что оно статистически значимо. Любое наблюдение следует подтверждать проверкой гипотез.

Варианты графического представления нескольких серий данных, а также группирование данных будут рассмотрены в статье Представление данных с помощью ящичных диаграмм. Часть 3.

<<< Представление данных с помощью ящичных диаграмм. Часть 1

Представление данных с помощью ящичных диаграмм. Часть 3 >>>

25.01.2010 / 2760 / Загрузок: 0 / DMAgIC /
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2017            Хостинг от uWeb