09.11.2017 | Добавил: dmagic | Просмотров: 251
Случайная выборка (Random Sample)

Вы уже знаете, что с помощью Minitab можно сгенерировать набор случайных данных любой величины, под любое распределение и с любыми параметрами. А если еще не знаете, или вы на этом сайте впервые, то обязательно начните с заметки Генератор случайных величин.

Кроме того, Minitab может помочь нам с отбором случайной выборки из массива наблюдений. Разумеется, программа не сделает за вас всю работу и физический отбор образцов все еще остается на ваших плечах, однако, по крайней мере, с выбором у вас не будет проблем.

Итак, запускаем Minitab:

  1. Для начала сгенерируем 100 наблюдений. Для этой заметки я выбрал распределение Пуассона и следующие параметры:
  2. Для демонстрации работы с различными данными, скопируем полученные данные в колонки C2 и C3.
    • Если вы повторяете за мной, то у вас должно было получиться 3 идентичных колонки с данными:
  3. Теперь изменим кодировку для колонок C2 и C3:
    • В меню Data выберите опцию Change Data Type.
    • В диалоговом окне укажите колонку C2 в поле Variables.
    • Из выпадающего списка Choose type выберите Text:
    • Таким образом, мы указали программе, что значения в колонке C2 следует воспринимать как текстовые.
    • Повторим те же операции для колонки С3, выбрав на этот раз дату или время. Если вы выбрали Elapsed time, то у вас должно было получиться так:
    • Появившиеся обозначения “T” и “D” в заголовках колонок свидетельствуют о кодировке данных – текст и дата, соответственно.

Теперь перейдем непосредственно к отбору проб – случайной выборке:

  1. В меню Calc выберите Random Data, а затем Sample From Columns.
  2. В диалоговом окне укажите:
    • В строке Number of rows to sample – количество образцов в выборке. Для примера нам будет достаточно 5.
    • В поле From columns – укажите, из какой колонки следует выбрать образцы. Начнем с первой – C1.
    • В поле Store samples in – укажите, в какой колонке записать значения выборки. Любая свободная подойдет, например C5.

  3. Нажмите OK.
  4. Повторите те же операции для колонок C2 и C3, сохраняя значения выборки в колонках C6 и C7.
  5. В результате у нас получилось 3 случайные выборки из трех колонок с данными:

Как вы видите, мы можем работать с числовыми, текстовыми и многими другими форматами данных. Кроме того, вы помните, что мы скопировали данные из колонки C1 в колонки C2 и C3, получив идентичные значения в строках (в первой строке 4, 4 и 4,00:00:00:000). В то же время значения в строках колонок C5, C6 и C7 отличаются (в первой строке 4, 5 и 4,00:00:00:000). Это говорит о том, что программа взяла выборку из каждой колонки, независимо от значений в других колонках.

Если повторить опыт или весь эксперимент от начала, то выборка будет всегда разной. Однако если вам понадобится воспроизвести выборку, получив уже неслучайные величины, то сделайте следующее:

  1. В меню Calc выберите Set Base.
  2. В диалоговом окне задайте номер алгоритма. Например, 777:

  1. Теперь каждый раз после задания номера алгоритма, вы получите одну и ту же выборку:

Обрабатываете большие массивы данных, и требуется сократить количество значений? А может, к вам пришла поставка деталей, и вы хотите выбрать коробки для входящего контроля качества? Тогда эта заметка – ваша инструкция.

Лин6Сигм / 09.11.2017 | Просмотров: 251 | Добавил: dmagic | Всего комментариев: 0 / Теги: выборка, Minitab
ПОХОЖИЕ МАТЕРИАЛЫ


  Добавить комментарий
avatar
SixSigmaOnline.ru © 2009-2017            Хостинг от uWeb