Run Chart – и графический, и статистический анализ в одном

Run Chart – это график, отражающий индивидуальные наблюдения в их хронологическом порядке. Следовательно, на русском название могло бы звучать как диаграмма временного ряда или график последовательности. Давайте договоримся, что первый вариант – диаграмма временного ряда – будет сохранен за инструментом Time Series Plot, а Run Chart мы будем называть, помимо оригинального названия, либо графиком последовательности, либо просто ран-чартом.

В нашем тренинге зеленых поясов Run Chart применяется на этапе измерений. Мы начинаем Measure с анализа сходимости и воспроизводимости измерительной системы, а затем сразу же строим график последовательности. Он помогает будущим зеленым поясам составить первое впечатление о данных.

Многие провайдеры тренингов шести сигм упускают этот инструмент, заменяя его контрольными картами или чем-то еще. Я не стану спорить о том, какой инструмент лучше подходит для первого взгляда на данные. Однако настоятельно рекомендую не исключать ран-чарт из программы подготовки зеленых и черных поясов шести сигм. И вот почему…

Давайте взглянем на данные с помощью графика последовательности. В следующей таблице вы найдете результаты тестов 30-и серий одного продукта. Скопируйте эту данные на рабочий лист программы Minitab.

СерияРезультатСерияРезультатСерияРезультатСерияРезультатСерияРезультатСерияРезультат
131,35888631,579211135,330761638,852722135,992432642,53631
143,99081637,422081128,022761641,76882135,12392640,68767
145,70775628,563481131,730711633,266232130,548022637,93859
136,12754640,876861137,068241637,216632136,099622631,3466
140,85668643,863121134,809831632,994782132,27622632,23085
232,5184738,868411232,244541727,212752241,013282735,31886
242,68956744,16251237,2971740,024472238,671652731,60009
243,06903738,017521232,547961740,569552229,272462729,20096
230,23726731,765321233,213641734,591972233,535222733,41046
242,65428736,628411234,564011732,979132243,723532735,27719
336,38679835,472311341,500381824,629612332,074912835,49063
346,29385833,110551340,062141833,719362336,667182841,0434
331,14903829,551971334,418891831,035992336,562862836,33781
328,39317840,892271339,397991838,310522333,262822840,61398
340,35737840,230621336,678851839,353562331,961992833,97901
429,46195944,528191434,240251930,759372433,444822934,99129
430,93988927,723851438,296641938,387712432,93542940,72214
440,31897940,27641423,868891935,599552436,332592940,73865
427,04788936,028671443,240761932,352032436,070232933,4276
440,02342929,555771438,327771934,385762439,941612937,14327
548,340921041,67381533,253552032,671622531,768083036,7406
525,828371034,639291541,314582039,173762537,144033040,32644
534,457971034,194671544,203292030,337022532,505393035,91536
529,043751032,134871550,088542033,713492533,461073032,65019
544,40741031,008841531,593872032,619622534,247233036,16327

Для того, чтобы данные занимали меньше места, я разместил их в несколько колонок. Нам же потребуется, чтобы все данные находились в одной колонке. Поэтому придется переорганизовать их.

Разумеется, это можно сделать вручную. Но для ленивых найдется и другой способ:

  1. В меню Data выберите Stack, а затем Columns.
  2. В следующем окне задайте все колонки с результатами измерений.
  3. Нажмите Ok.

Теперь наши данные размещены в одной колонке на новом листе. Вы можете сравнить последовательность значений, чтобы убедиться, что значения не смешались – последовательность сохранилась.

Мы не добавили номера серий, но в данном случае можно обойтись и без этого. Мы просто укажем программе, что размер выборки равен 5 – ведь во всех сериях по 5 наблюдений.

Чтобы построить Run Chart:

  1. В меню Stat выберите Quality Tools, а затем Run Chart.
  2. В диалоговом окне задайте колонку с результатами измерений. Если вы повторяли все действия в точности за мной, то все наблюдения должны были перекочевать в колонку C2 нового листа.
  3. В строке Subgroup size задайте вручную число 5 – это величина нашей выборки в каждой серии.
  4. Нажмите Ok.

Результаты анализа

Когда вы выполняете ту или иную процедуру анализа в Minitab, то обычно рассчитываете получить графики отдельно от результатов. Результаты расчетов чаще всего выводятся в окне Session. В случае с графиком последовательности все расчеты выписаны непосредственно под графиком, что, на мой взгляд, очень удобно.

Интерпретация результатов анализа

Начнем с диаграммы. Мы задали размер выборки равным 5. Для каждой группы из 5 результатов измерений программа рассчитала среднее значение. На графике оно показано темно-синей точкой. Линия, соединяющая все темно-синие точки, показывает нам, как изменялось среднее с течением времени. Это своего рода Xbar-Chart или кривая на карте средних значений.

Также на графике мы видим светло-серые точки. По 5 точек, расположенных выше и ниже каждой темно-синей точки. Это – отдельные результаты наблюдений. С их помощью мы можем оценить размах, реже – наличие выбросов. К примеру, вы можете заметить, что светло-серые точки в самом конце кривой расположены намного ближе к темно-синей точке, нежели в начале графика. Это свидетельствует о меньшем размахе – большей кучности наблюдений.

Также обратите внимание на серии 14 и 15: в каждой из этих серий находится одна точка, которая заметно удалена от остальных. Кроме того, эти точки являются минимальным и максимальным значениями. Это не является доказательством наличия выбросов, но может послужить отправной точкой для проверки этой гипотезы.

Теперь самое интересное – результаты статистических расчетов, которые вы найдете в двух табличках под графиком. В процессе построения ран-чарта, Minitab проводит два очень простых и в то же время весьма интересных теста, чтобы оценить рандомность (случайность) наблюдений.

  1. Количество ранов над медианой. Результаты теста находятся в первой таблице.
  2. Количество ранов “вверх” и “вниз”. Результаты теста находятся во второй таблице.

Что такое Run (ран или прогон)? Это 1 и больше последовательных точек, которые находятся с одной стороны и/или следуют в одном направлении. Ран заканчивается, когда линия, соединяющая темно-синие точки, пересекает медиану или меняет направление.

С помощью таких простых критериев программа определяет необычное поведение данных.

Смесь – Mixture

Кластеризация – Clustering

Если количество ранов над медианой превышает ожидаемое количество, то вероятно, данные являются смесью двух или более популяций. Это явление называют смесью (Mixture).

Если количество ранов меньше ожидаемого, то возможно, мы имеем дело с кластерами (Clustering).


В примере выше, таблица 1:

  • Number of runs about median (количество ранов над медианой) – 13.
  • Expected number of runs (ожидаемое количество ранов) – 16.
  • Longest run about the median (самый длинный ран) – 5.
  • Approx P-Value for Clustering (вероятность кластеризации) – 0,132.
  • Approx P-Value for Mixtures (вероятность смесей) – 0,868.

Из всей таблицы нас больше всего интересуют два последних значения – вероятность нахождения кластеров и смесей – признаки необычного (нерандомного) поведения данных.

Оба значения выше альфа-риска (0,05). О чем это говорит? Нулевая гипотеза в данном тесте: последовательность наблюдений рандомна (случайна). Таким образом, мы не можем отклонить нулевую гипотезу.

Второй тест:

Тренды – Trends

Осцилляция – Oscillation

Если количество ранов “вверх” и “вниз” меньше ожидаемого, то мы наблюдаем тренды.

Если количество ранов “вверх” и “вниз” превышает ожидаемое, то мы имеем дело с осцилляцией.


В примере выше, таблица 2:

  • Number of runs up or down (количество ранов “вверх” и “вниз”) – 17.
  • Expected number of runs (ожидаемое количество ранов) – 19,7.
  • Longest run up or down (самый длинный ран “вверх” или “вниз”) – 4.
  • Approx P-Value for Trends (вероятность трендов) – 0,117.
  • Approx P-Value for Oscillation (вероятность осцилляции) – 0,883.

Как и в предыдущем тесте, мы смотрим на два последних значения – вероятность трендов и осцилляций. И, как и в предыдущем случае, оба значения выше уровня значимости (0,05), а следовательно, мы не можем отклонить нулевую гипотезу о рандомности (случайности) наблюдений.

Вывод

  1. Run Chart – очень простой способ взглянуть на данные и всего за несколько кликов провести графический и статистический анализ.
  2. Тест рандомности наблюдений не принимает во внимание закон распределения, а значит без опаски может быть применен для первичной оценки наблюдений.
  3. В рассмотренном примере не было замечено каких-либо отклонений от случайного поведения данных. Мы не обнаружили тренды или осцилляцию, смеси или кластеры.
16.05.2018 / 487 / Загрузок: 0 / DMAgIC / | Теги: графический анализ, статистический анализ, Run Chart, Minitab
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2018            Хостинг от uWeb