Подводные камни Парето анализа. Часть 2

В английском языке существует выражение-каламбур: "Pareto Paralysis”. Звучит очень близко к Pareto Analysis (Парето анализ) однако вместо анализа означает паралич. Что подразумевают под этим понятием, каковы наиболее вероятные причины его возникновения, а также, как с ним бороться – рассмотрим в этой статье.

Принцип Парето гласит о том, что 80% всех эффектов (будь то прибыль от продажи или дефекты продукции) вызваны 20% всех причин (к примеру, наименований товаров или возможных ошибок). Следовательно, остальные 20% последствий, вызваны 80% всех остальных причин. Это правило позволяет нам выделить приоритетные направления работы или, определив группу товаров, приносящую основную долю прибыли, следить за ее постоянным пополнением на складе или полке магазина.

Осуществление принципа 80/20 проиллюстрировано в статье Построение диаграмм Парето на примере одного из опросов, проводимых нашим сайтом – "Каким программным обеспечением Вы пользуетесь для работы с данными?”. Актуальные результаты опроса отражены на следующей диаграмме:

Одна из разновидностей Парето анализа – ABC-анализ, чаще всего применяемая в торговле, позволяет выделить среди всех наименований товаров три группы: соответственно, A, B и C в зависимости от объема продаж или оборота средств. Проиллюстрировать ABC-анализ нам помогут посетители нашего сайта (статистика за апрель 2011):

Оба рассмотренных примера иллюстрируют соблюдение правила Парето. Рассмотрим результаты еще одного опроса, проведенного нашим сайтом в качестве примера несоблюдения принципа 80/20:

В какой промышленности Вы работаете?

Невооруженным глазом заметно, что категория "Другое” занимает первое место, хотя теоретически не должна превышать 5%. Составные этой категории нам не известны: с равной вероятностью можно утверждать, что среди них весомые категории или различные ответы, не объединенные единой категорией. Следовательно, классификация собранных данных не позволяет применить к полученным результатам Парето анализ.

Парето анализ, показанный на примере следующей диаграммы, превращается в паралич:

Можно избрать "легкий путь" и выделить определенное количество категорий – Тор3 или Тор5. Можно даже построить диаграмму Парето, в которой категория "Другое” будет находиться на последнем месте. Однако, эффективность такого анализа, а, следовательно, и корректность сделанных выводов – под вопросом, ведь нет абсолютно никаких доказательств соблюдения принципа Парето.

В каких случаях может наблюдаться подобное явление?

  1. Непригодная измерительная система зачастую приводит к нехарактерному типу диаграмм ввиду того, что "размывает” причину ошибки по нескольким категориям и, может привести к неверным суждениям.
  2. Нестабильный процесс – сбор данных о нестабильном процессе может в результате показать, что все категории равны или близки по значению. Вид диаграммы аналогичен предыдущему пункту.
  3. Ошибки сбора данных/системные ошибки:

    • Слишком мало данных или слишком короткий период сбора данных – размер выборки или период времени, за который собраны данные, играет важнейшую роль в анализе. Если выборка не отражает информацию о популяции то вполне вероятно, что и выделить основные причины не удастся.
    • Слишком много данных или слишком длительный период сбора данных приводит к выбору "устаревших” приоритетов. К примеру, проблемы, которые были приоритетными вчера, на прошлой неделе, или в прошлом месяце могут не отражать актуальную ситуацию.
    • Неправильный выбор (градация) категорий чаще всего приводит к тому, что набольший приоритет получает категория прочее. Яркий пример – опрос на нашем сайте относительно отрасли, в которой заняты наших читателей.

Тем не менее, неутешительный результат не означает отсутствие информации. Если причина кроется в одном из первых двух пунктов, то валидация процесса или измерительной системы поможет определить причины. В случае системных ошибок решение целиком зависит от исследователя. Однако, вот несколько советов как их избежать:

  1. Статистически обосновать размер выборки, а также убедиться, что во время сбора данных на процесс не влияют специальные факторы.
  2. При выборе приоритетных категорий проследить их динамику за более короткие промежутки времени, к примеру, анализируя топы за месяц отследить тренд по неделям.
  3. Выделяя категорию "Другое”, вести более подробные записи о наблюдениях (хороший пример: опросы с возможностью оставить комментарий).
13.06.2011 / 4294 / Загрузок: 26 / DMAgIC /
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2018            Хостинг от uWeb