16.10.2017 | Добавил: dmagic | Просмотров: 216
Что за странный график из листьев и стеблей?

За причудливым названием сегодняшней заметки скрывается краткое руководство по построению и применению очень серьезного и полезного инструмента графического анализа – графика Stem-and-Leaf, что в переводе означает “лист и стебель” или “стебель-лист”.

Любая, даже самая красочная, публикация о графиках и графическом анализе должна начинаться с сухих данных. Итак, открываем Minitab и выбираем Calc > Random Data > Normal. Как работать в диалоговом окне и что там можно задать, смотрите в заметке Генератор случайных величин. Ниже показано, какие данные были использованы для этой заметки:

Нажав Ok, получаем 100 значений и переходим к следующему шагу:

  1. В меню Graph выберите Stem-and-Leaf…
  2. Затем в диалоговом окне укажите колонку с данными.
  3. Остальные поля оставьте без изменений:

Нажав Ok… не получаем ничего. Ни графика, ни сообщения об ошибке… Не переживайте, это не глюк программы. Просто ваш график построен непривычным для вас способом. Загляните в окно Session и обнаружите странную абракадабру. Это и есть Stem-and-Leaf – график “лист и стебель”.

Что мы видим? Как следует из заголовка – Stem-and-Leaf для значений в колонке C1. Количество наблюдений равно 100, а Leaf Unit – единицы построения “листа” диаграммы – 0,10. Далее следуют 3 колонки с непонятными нам числами. Давайте попробуем в них разобраться.

То, что вы видите – Stem-and-Leaf, – является неким подобием диаграммы, выполненной из чисел. Первая колонка содержит счет значений. К примеру, единица – первое значение – говорит нам о том, что среди наших данных есть одно значение с величиной 7,6. Не спешите его искать на листе с данными. Давайте рассчитаем базовые статистики – так проще:

Как видите, минимальное значение равно 7,620. Это не совсем 7,6, зато теперь мы знаем об одном из недостатков диаграммы Stem-and-Leaf – низком разрешении или необходимости округлять числа для того, чтобы построить график.

Второе значение в первой колонке – 5 – свидетельствует о том, что у нас 5 наблюдений 8,2, 8,3, 8,3 и… вышеупомянутое 7,6. Теперь вы знаете, что счет ведется не только значений, которые находятся в этой строке, но и всех предыдущих.

Присмотритесь внимательно: в первой колонке можно найти число 19, заключенное в круглые скобки. Так программа сигнализирует о том, что в настоящей строке находится медиана. Значения в этой строке содержат величины от 10,0 до 10,3. Медиана (см. перечень описательных статистик) равна 10,135.

Вторая колонка называется Stem – стебель. В этой колонке находятся все целые значения. Вместо 7, 62 мы найдем здесь 7, а вместо 13,491 (максимальное значение) – 13. Обратите внимание, что одни значения (например, 7 и 13) встречаются всего 1 раз, в то время как другие (8, 9, 10, 11 и 12) могут встречаться 2 и более раз. Об этом следует помнить, оценивая диаграмму визуально.

Третья колонка – Leaf или лист, – содержит все десятичные значения – по одному значению для каждого наблюдения. Если вы сосчитаете все цифры в этой колонке, то обнаружите, что их 100, как и сгенерированных нами данных.

Теперь давайте повернем нашу диаграмму на 90 градусов:

В таком виде наш “стебель-лист” может сойти за столь знакомую нам гистограмму, с тем лишь отличием, что вместо колонок у нас десятые, а вместо подписей горизонтальной оси – числа, формирующие стебель.

Все полезные свойства гистограммы, точечной и ящичной диаграммы можно, так или иначе, получить из Stem-and-Leaf: разброс наблюдений, среднее – медиану и моду. Теоретически можно также диагностировать выбросы, хотя это и несколько осложнено. Сравните с другими графиками:

В плане диагностики выбросов Stem-and-Leaf явно проигрывает.

Диаграмма “лист и стебель” удобнее гистограммы, когда под руками нет ПК и пакета статистической обработки данных. Для ее построения достаточно карандаша и листа бумаги в клеточку. Можно собирать данные и одновременно строить “гистограмму” прямо в цеху. Эдакая Gemba-гистограмма.

В то же время, не стоит забывать и о недостатках, которыми обладает этот график. Кроме вышеупомянутых, следует добавить меньшую распространенность и более низкую визуализацию, по сравнению с гистограммой или точечной диаграммой.

Лин6Сигм / 16.10.2017 | Просмотров: 216 | Добавил: dmagic | Всего комментариев: 0 / Теги: Stem-and-Leaf, графический анализ, Minitab
ПОХОЖИЕ МАТЕРИАЛЫ


  Добавить комментарий
avatar
SixSigmaOnline.ru © 2009-2017            Хостинг от uWeb