Корреляционный анализ
09.04.2015 / 5013 / Загрузок: 291 / DMAgIC / Комментарии: 9
Всего комментариев: 9
0
1  
На 16 слайде в каждом окошке по 2 линии. Объясните, пожалуйста, почему по две?
Ответ: Для сравнения. В этой части презентации идет речь о нелинейной корреляции. Поэтому кроме функции взаимосвязи переменных, дополнительно нанесена прямая линия.

0
2  
Ещё одно важное дополнение. Наличие корреляции между двумя переменными ещё не говорит о зависимости одного от другого.
В одной из книг по статистике приводится два замечательных примера:
1. Если построить корреляционную зависимость количества жертв при пожаре от количества пожарных, принимавших участие в тушении, то получится прямая зависимость. Но это не значит, что уменьшая количество пожарных, мы снизим количество жертв. Это значит, что, чем больше пожарных участвовало в пожаре, тем сильнее был пожар и, следовательно, жертв будет больше.
2. Проведя исследование в канадских деревнях, ученые обнаружили прямую корреляцию между количеством аистов и количеством детей в деревне...Хотя тут и так всё понятно tongue

0
3  
Отличные примеры!

А это все или только самые интересные? Может покумекаем вместе над созданием списка, где корреляция допускает epic fail?

1
4  
Да нет. Есть очень забавный пример из практики. При анализе данных ЭШП (электрошлакового переплава). Основная цель ЭШП - получить чистую по сере сталь (содержание серы до 0,005%). При этом, когда были проанализированы данные по количеству удалённой серы и остаточному содержанию, получили прямую зависимость - чем больше серы "ушло" в процессе ЭШП, тем больше серы имеем в остатке (парадокс!). Тут фокус был в том, что учитывалось абсолютное значение. А связаны эти переменные были через исходное содержание. Чем выше исходное содержание - тем больше серы уходит при ЭШП, но, тем больше её остаётся в итоге. И наоборот, чем меньше было серы в исходной плавке, тем менее активно она уходит из расплава, но, поскольку первоначальное содержание уже было достаточно мало, в конечном итоге серы оказывается меньше. В итоге, всё логично.

0
6  
Отличный пример! Спасибо за иллюстрацию.

0
5  
Ну и для тех, кто знает английский, можно выяснить, как связаны "потребление сыра сорта моцарелла" и "защиты докторских степеней" или, например, "количество меда, получаемое с пчелиных колоний в год" и "количество арестов за хранение марихуаны"...
http://www.tylervigen.com/
В общем, корреляция показывает только то, что между переменными присутствует связь. А вот зависит ли одно от другого, или же оба параметра зависят от какого-то третьего фактора - это уже может выяснить только специалист в данной конкретной области.
Кому понравилась ссылка, можно вбить в любом поисковике funny correlations - результатов море.

0
7  
Спасибо за наводку. Думаю, небольшой заметке со списком "epic correlation fail" быть smile

0
8  
Всегда пожалуйста, приятно бывает внести хоть маленькую лепту в столь большое дело smile

0
9  
Шведские ученые доказали, что витаминные добавки убивают людей! Прием антиоксидантов в среднем увеличивает коэффициент смертности на 5%! Отдельно витамин Е — на 4%, бета-каротин — на 7%, витамин А — на 16%!

Перепутать причину и следствие очень просто: больше общеукрепляющих средств принимают те люди, которые хуже себя чувствуют, больше болеют и, соответственно, скорее умирают.

Имя *:
Email *:
Код *:
SixSigmaOnline.ru © 2009-2017            Хостинг от uWeb