Типы данных

Классифицировать данные можно различными способами. Из всего разнообразия способов классификации и бесконечности типов данных практикам шести сигм достаточно понимать, что все переменные можно разделить на 2 категории:

Непрерывные можно измерять с помощью некой шкалы: температура, расстояние, концентрация… Такие данные еще называют переменными. Атрибутивные данные измерять с помощью шкалы невозможно – им присваивают некий атрибут: некое качество (цвет), подсчитанное количество (количество дефектов, найденных заказчиком) или частоту возникновения (частота проведения аудита).

Если у вас под рукой есть градусник, то вы можете измерить температуру воды в стакане и получить непрерывные данные. Если же градусника нет то температуру можно измерить пальцем. Однако, собранные таким образом данные, будут атрибутивными: холодно-тепло-горячо. Таким образом, наличие шкалы измерения – это один из способов, как разделить данные по категориям.

Атрибутивные данные можно также разделить на 2 группы: номинальные (именные или категориальные) и порядковые (ординарные):

Первая группа предполагает присвоение имен, которые никак между собой не связаны. К номинальным данным принадлежат: пол, семейное положение, национальность, тип дефекта на продукте, цвет и т.д. В пачке конфет красные, желтые и зеленые драже – это номинальные данные. Золушка перед балом делила содержание миски на две категории: горох и мак – это тоже номинальные данные.

Вторая группа предполагает не только возможность присвоения имени, но и возможность неким способом ранжировать данные исходя из присвоенных атрибутов. Измерение температуры воды в стакане пальцем – это пример сбора ординальных данных. Атрибуты холодный, теплый, горячий можно ранжировать – можно точно сказать, что в одном стакане вода холоднее, чем в другом… К ординальным данным можно отнести: критичность дефекта, принадлежность к экономическому слою общества, возрастная категория, уровень образования (начальное, среднее, высшее). Разделение мужчин на лысых, плешивых и “волосатых” также пример ординальных данных.

Непрерывные данные можно также разделить на две категории – интервальные и относительные:

Интервальные данные, кроме ранжирования данных, предоставляют возможность выразить в числовом формате различие между ними. Примеры интервальных данных: летоисчисление (наша эра или от рождества Христова), шкала кислотности (pH), направление в градусах от полюса, большинство процентных показателей…

Относительные данные, кроме различия, выраженного в числовом формате, позволяют соотнести наблюдения с абсолютным нулем. К таким данным относятся: геометрические размеры, объем в литрах, скорость в км/час…

Интересным примером отличия интервальных и относительных данных является температура, выраженная в градусах Цельсия и кельвинах. Логично, что 20°С выше, чем 10°С. Вы можете сказать, что первая величина выше на 10°С, однако вы не можете утверждать, что температура выше в 2 раза. В то же время 20К выше, чем 10К на 10 кельвинов и в два раза. Причина в том, что у шкалы Кельвина есть абсолютный 0, а у шкалы градусов Цельсия – нет.

Следует также заметить, что большинство статистических методов, используемых практиками шести сигм, не требует различия интервальных и относительных данных.

От номинальных к относительным возрастает информативность данных. В том же направлении увеличивается сложность сбора данных (на рисунке показано обратное направление для увеличения простоты сбора данных).

Выводы

Сбор данных – одна из важнейших задач, с которой приходится иметь дело практикам шести сигм. Трудности, которые при этом возникают, могут быть вызваны как сложностью наблюдаемых процессов, так и недостаточным пониманием того, что такое данные и какими они могут быть.

Если внимательно изучить рассмотренные типы данных, то обнаружится одна закономерность – каждый следующий тип обладает всеми свойствами предыдущего и одним отличием:

Классификация и понимание типов данных не только облегчит поиск ответа на вопрос “что и как можно измерять?” на этапе измерений (Measure), но и поможет в подборе метода анализа, теста гипотез, контроля стабильности процесса и т.д.

07.10.2015 / 1443 / Загрузок: 0 / DMAgIC /
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2017            Хостинг от uWeb