11.03.2019 | Добавил: voliadis | Просмотров: 170
Наглядная статистика. Используем R

В начале 2012 года была опубликована книга “Наглядная статистика. Используем R!”. Авторский коллектив состоит из семи человек:

  • кандидат биологических наук, русский переводчик R – Шипунов А.Б.,
  • кандидат физ.-мат. наук Балдин Е.М.,
  • кандидат биологических наук Волкова П.А.,
  • кандидат физ.-мат. наук Коробейников А.И.,
  • кандидат биологических наук Назарова С.А.,
  • кандидат медицинских наук и магистр технических наук Петров С.В.,
  • кандидат физ.-мат. наук Суфиянов В.Г.

В книге довольно просто объясняются основные вопросы статистического анализа. Однако эта книга не является учебником по статистике и не сделает из читателя профессионала-статистика. Польза ее в другом. Это хорошее и достаточно объемное руководство по анализу данных с использованием языка R. Оно будет полезно для тех, кто только начинает работать с R.

Начинается книга с главы “Что такое данные и зачем их обрабатывать”. Это вводная теоретическая глава, в которой рассказывается о самых общих понятиях анализа данных. Здесь описана суть таких способов получения данных как наблюдение и эксперимент, их сильные и слабые стороны. В главе рассказано о том, что такое выборочные исследования, о принципах повторности и рандомизации, а также о том, какие существуют направления в анализе данных. Глава написана очень кратко и просто. Информация, которая здесь представлена, будет полезна лишь “для самых маленьких”, т.е. для читателей, не сталкивавшихся ранее с анализом данных.

В главе “Как обрабатывать данные” описана краткая история языка R и его прототипа, языка S. Описаны преимущества и недостатки R. Даны рекомендации по установке и основным приемам использования системы R: ввод данных, простейшие расчеты, сохранение результатов и создание графиков. Освоив материал этой главы, пользователь сможет получить базовые навыки программирования в R, что нужно для успешного понимания следующих глав книги.

В следующей главе “Типы данных” простым и понятным языком дается характеристика разных шкал измерения и соответствующих им типов данных в языке R. Кратко рассказывается о преобразовании данных из одного типа в другой, об обработке пропущенных данных и выбросов. В конце главы идет речь о таких формах представления данных в языке R как матрицы, списки и таблицы. Описаны области их применения, способы создания и применения на практике.

Начиная с главы “Великое в малом: одномерные данные” авторы приступают непосредственно к вычислениям. Начинается все с одномерных методов, т.е. способов проанализировать одну выборку. Описывается оценка центральной тенденции (среднее, медиана и пр.) и размаха выборки. Используются как числовые, так и графические методы. Затем объясняется применение одномерных статистических тестов: тест Стьюдента для одной выборки, ранговый тест Уилкоксона, тест Шапиро-Уилкса, биномиальный тест и тест пропорций. В этой же главе читатель может научиться создавать собственные функции на языке R.

Далее, в главе “Анализ связей: двумерные данные” идет речь о том, как работать с двумя выборками. Дается понятие о статистической гипотезе, статистической ошибке. Описывается сравнение двух выборок параметрическими и непараметрическими методами, сравнение выборок из категориальных данных, корреляционный и регрессионный анализ, логистическая регрессия. Также объясняется особенность сравнения более чем двух выборок.

Шестая глава (“Анализ структуры: data minig”) описывает т.н. data mining – методы, позволяющие провести анализ структуры данных, особенно данных большого размера. Начинается глава с описания способов визуализации многомерных данных: диаграммы рассеяния, пиктограммы. Далее даются примеры использования методов сокращения размерности, что необходимо для построения понятного графика. В том числе, в главе описаны метод анализа главных компонент, классификация без обучения (кластерный анализ) и классификация с обучением (дискриминантный анализ).

В предпоследней главе книги авторы пишут об анализе временных рядов. В данной книге рассмотрены только самые основные принципы работы с временными рядами. Временные ряды – это набор данных, который был получен путем проведения замеров некоторой величины через определенные интервалы времени. Из данной главы можно узнать, что такое тренд, автокорреляция, автокорреляционная функция и кросс-корреляция. Читатель сможет научиться строить временные ряды, выполнять базовые манипуляции с ними, а также строить модель временного ряда и использовать ее для прогноза изменений в наблюдаемом процессе.

В заключительной главе “Статистическая разведка” дается краткое резюме всей книги, а также описываются возможности системы R в плане автоматизации составления отчетов. В конце книги имеются приложения, которые занимают треть всего ее объема. В приложении А дается практический пример анализа одного набора данных в R. Здесь нет каких-либо теоретических объяснений, только последовательность команд с краткими комментариями к ним. В приложении Б описываются графические интерфейсы для языка R. По моему мнению, графические интерфейсы только усложняют работу: самый простой и надежный интерфейс для R - командная строка. В приложении В даны основы программирования на языке R. Данное приложение будет полезно тем, кто уже знаком с программированием. Здесь вкратце описаны базовые объекты языка, операторы и функции, а также способы отладки кода в среде R. Приложение Г представляет собой выдержки из документации языка R, которые позволят глубже понять его использование. В приложениях Д и Е приведены краткий словарь языка R и список терминов, упоминавшихся в книге.

Таким образом, книгу “Наглядная статистика. Используем R!” можно рекомендовать тем, кто хочет научиться практическому применению основных методов анализа данных с использованием языка R.

Если вы дочитали эту заметку до конца, то вам будет интересно узнать, что эта книга передана в общественное достояние. Скачивайте на здоровье!

Лин6Сигм / 11.03.2019 | Просмотров: 170 | Добавил: voliadis | Всего комментариев: 0 / Теги: язык R, Книги, статистика
ПОХОЖИЕ МАТЕРИАЛЫ


  Добавить комментарий
avatar
SixSigmaOnline.ru © 2009-2019            Хостинг от uWeb