Парето анализ в R

Парето анализ или правило “80/20” является одним из наиболее широко распространенных инструментов качества и шести сигм. Принцип анализа предельно прост, но весьма эффективен и, что самое главное, применим практически в любых ситуациях. Именно поэтому, несмотря на ранее опубликованные материалы на нашем сайте и в сети, информация о принципе Парето и его графической реализации представляет актуальную задачу.

Перед тем как приступать к изучению этого материала мы настоятельно рекомендуем читателю ознакомиться с уже существующими публикациями на сайте SixSigmaOnline.ru, так как в настоящей статье рассмотрена лишь практическая часть анализа – построение диаграмм Парето в среде R и некоторые особенности настройки.

Для построения диаграммы Парето, мы используем тот же набор данных, что и в статье Построение диаграмм Парето:

Также нам потребуется программа R и пакет “qcc”. Исходные данные мы предварительно сохранили в csv-файл и прикрепили к настоящей публикации. Файл доступен всем зарегистрированным пользователям. Сохраните файл в папку “Мои документы” и задайте данные в программу с помощью команды:

> x<-read.csv(file="Pareto.csv", header=TRUE, sep=";", dec=",")

Таким образом, переменной x присвоены все значения файла Pareto.csv. Введя команду:

> pareto.chart(x[,2])

получим диаграмму Парето количества дефектных образцов в партиях:

Несмотря на то, что график нам удалось довольно легко построить, особой информативностью он не отличается. Попробуем применить некоторый “тюнинг”, для этого разделим две колонки в разные переменные:

> defect<-x[,2]
> names(defect)<-x[,1]
> pareto.chart(defect)

Подпишем оси диаграммы:

> pareto.chart(defect, ylab = "Количество дефектных образцов", xlab = "Партия")

Изменим команду, чтобы категории не накладывались на подпись оси X:

> pareto.chart(defect, ylab = "Количество дефектных образцов", xlab = "Партия", las=1)

Теперь добавим название, изменим шкалу “Y” и поменяем цвет колонок:

> pareto.chart(defect, ylab = "Количество дефектных образцов", xlab = "Партия", las=1, main= "Количество дефектных образцов в партиях", ylim=c(0, 500), col=rainbow(length(defect)))

Алгоритм полностью:

    library("qcc")
    x<-read.csv(file="Pareto.csv", header=TRUE, sep=";", dec=",")
    # Pareto Chart
    x<-read.csv(file="Pareto.csv", header=TRUE, sep=";", dec=",")
    defect<-x[,2]
    names(defect)<-x[,1]
    pareto.chart(defect, ylab = "Количество дефектных образцов", xlab = "Партия", main= "Количество дефектных образцов в партиях", col=rainbow(length(defect)))

Результат:

Pareto chart analysis for defect
          Frequency Cum.Freq. Percentage Cum.Percent.
  A-31-10       370      370   18.810371     18.81037
  M-28-10       269      639   13.675648     32.48602
  M-15-10       231      870   11.743772     44.22979
  J-09-10       189      1059   9.608541     53.83833
  F-05-10       158      1217   8.032537     61.87087
  J-04-10       150      1367   7.625826     69.49670
  O-16-09       121      1488   6.151500     75.64820
  S-25-10       114      1602   5.795628     81.44382
  A-11-10        99      1701   5.033045     86.47687
  J-12-10        92      1793   4.677173     91.15404
  N-18-09        89      1882   4.524657     95.67870
  D-03-09        85      1967   4.321301    100.00000

Вся конфигурация занимает не более 5 минут. Вы можете скопировать весь алгоритм и, применив его к прикрепленному файлу, убедиться в этом.

12.12.2011 / 2602 / Загрузок: 36 / DMAIC /
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2018            Хостинг от uWeb