Парето анализ в R

Парето анализ или правило “80/20” является одним из наиболее широко распространенных инструментов качества и шести сигм. Принцип анализа предельно прост, но весьма эффективен и, что самое главное, применим практически в любых ситуациях. Именно поэтому, несмотря на ранее опубликованные материалы на нашем сайте и в сети, информация о принципе Парето и его графической реализации представляет актуальную задачу.

Перед тем как приступать к изучению этого материала мы настоятельно рекомендуем читателю ознакомиться с уже существующими публикациями на сайте SixSigmaOnline.ru, так как в настоящей статье рассмотрена лишь практическая часть анализа – построение диаграмм Парето в среде R и некоторые особенности настройки.

Для построения диаграммы Парето, мы используем тот же набор данных, что и в предыдущей статье

Сохраним его в csv-файл и разместим файл в папке “Мои документы”. Также нам потребуется программа R и пакет “qcc”. Указать на файл можно с помощью следующей команды:

x<-read.csv(file="Pareto.csv", header=TRUE, sep=";", dec=",")


Таким образом переменной x присвоены все значения файла Pareto.csv. Введя команду:

pareto.chart(x[,2])


получим диаграмму Парето количества дефектных образцов в партиях:

Несмотря на то, что график нам удалось довольно легко построить, особой информативностью он не отличается. Попробуем применить некоторый “тюнинг” – для этого разнесем две колонки в разные переменные:

defect<-x[,2]
names(defect)<-x[,1]
pareto.chart(defect)

Подпишем оси диаграммы:

pareto.chart(defect, ylab = "Количество дефектных образцов", xlab = "Партия")

Изменим команду, чтобы категории не накладывались на подпись оси X:

pareto.chart(defect, ylab = "Количество дефектных образцов", xlab = "Партия", las=1)

Теперь добавим название, изменим шкалу “Y” и поменяем цвет колонок:

pareto.chart(defect, ylab = "Количество дефектных образцов", xlab = "Партия", las=1, main= "Количество дефектных образцов в партиях", ylim=c(0, 500), col=rainbow(length(defect)))

Алгоритм полностью:

library("qcc")
x<-read.csv(file="Pareto.csv", header=TRUE, sep=";", dec=",")
# Pareto Chart
x<-read.csv(file="Pareto.csv", header=TRUE, sep=";", dec=",")
defect<-x[,2]
names(defect)<-x[,1]
pareto.chart(defect, ylab = "Количество дефектных образцов", xlab = "Партия", main= "Количество дефектных образцов в партиях", col=rainbow(length(defect)))


Результат:

Pareto chart analysis for defect
          Frequency Cum.Freq. Percentage Cum.Percent.
  A-31-10       370       370  18.810371     18.81037
  M-28-10       269       639  13.675648     32.48602
  M-15-10       231       870  11.743772     44.22979
  J-09-10       189      1059   9.608541     53.83833
  F-05-10       158      1217   8.032537     61.87087
  J-04-10       150      1367   7.625826     69.49670
  O-16-09       121      1488   6.151500     75.64820
  S-25-10       114      1602   5.795628     81.44382
  A-11-10        99      1701   5.033045     86.47687
  J-12-10        92      1793   4.677173     91.15404
  N-18-09        89      1882   4.524657     95.67870
  D-03-09        85      1967   4.321301    100.00000

Вся процедура занимает не более 5 минут. Вы можете скопировать весь алгоритм и убедиться в этом самостоятельно.

12.12.2011 / 53 / Загрузок: 0 / DMAIC / | Теги: язык R, Парето
Всего комментариев: 0
avatar
SixSigmaOnline.ru © 2009-2020            Хостинг от uWeb