Корреляционный анализ
09.04.2015 / 4880 / Загрузок: 291 / DMAgIC / Комментарии: 9
Всего комментариев: 9
avatar
0
1 olgaz • 13:10, 13.04.2012
На 16 слайде в каждом окошке по 2 линии. Объясните, пожалуйста, почему по две?
Ответ: Для сравнения. В этой части презентации идет речь о нелинейной корреляции. Поэтому кроме функции взаимосвязи переменных, дополнительно нанесена прямая линия.
avatar
0
2 toliktkm • 08:27, 05.05.2015
Ещё одно важное дополнение. Наличие корреляции между двумя переменными ещё не говорит о зависимости одного от другого.
В одной из книг по статистике приводится два замечательных примера:
1. Если построить корреляционную зависимость количества жертв при пожаре от количества пожарных, принимавших участие в тушении, то получится прямая зависимость. Но это не значит, что уменьшая количество пожарных, мы снизим количество жертв. Это значит, что, чем больше пожарных участвовало в пожаре, тем сильнее был пожар и, следовательно, жертв будет больше.
2. Проведя исследование в канадских деревнях, ученые обнаружили прямую корреляцию между количеством аистов и количеством детей в деревне...Хотя тут и так всё понятно tongue
avatar
0
3 dmagic • 18:32, 05.05.2015
Отличные примеры!

А это все или только самые интересные? Может покумекаем вместе над созданием списка, где корреляция допускает epic fail?
avatar
1
4 toliktkm • 08:10, 06.05.2015
Да нет. Есть очень забавный пример из практики. При анализе данных ЭШП (электрошлакового переплава). Основная цель ЭШП - получить чистую по сере сталь (содержание серы до 0,005%). При этом, когда были проанализированы данные по количеству удалённой серы и остаточному содержанию, получили прямую зависимость - чем больше серы "ушло" в процессе ЭШП, тем больше серы имеем в остатке (парадокс!). Тут фокус был в том, что учитывалось абсолютное значение. А связаны эти переменные были через исходное содержание. Чем выше исходное содержание - тем больше серы уходит при ЭШП, но, тем больше её остаётся в итоге. И наоборот, чем меньше было серы в исходной плавке, тем менее активно она уходит из расплава, но, поскольку первоначальное содержание уже было достаточно мало, в конечном итоге серы оказывается меньше. В итоге, всё логично.
avatar
0
6 dmagic • 10:01, 08.05.2015
Отличный пример! Спасибо за иллюстрацию.
avatar
0
5 toliktkm • 08:19, 06.05.2015
Ну и для тех, кто знает английский, можно выяснить, как связаны "потребление сыра сорта моцарелла" и "защиты докторских степеней" или, например, "количество меда, получаемое с пчелиных колоний в год" и "количество арестов за хранение марихуаны"...
http://www.tylervigen.com/
В общем, корреляция показывает только то, что между переменными присутствует связь. А вот зависит ли одно от другого, или же оба параметра зависят от какого-то третьего фактора - это уже может выяснить только специалист в данной конкретной области.
Кому понравилась ссылка, можно вбить в любом поисковике funny correlations - результатов море.
avatar
0
7 dmagic • 10:05, 08.05.2015
Спасибо за наводку. Думаю, небольшой заметке со списком "epic correlation fail" быть smile
avatar
0
8 toliktkm • 13:32, 08.05.2015
Всегда пожалуйста, приятно бывает внести хоть маленькую лепту в столь большое дело smile
avatar
0
9 dmagic • 18:25, 07.08.2015
Шведские ученые доказали, что витаминные добавки убивают людей! Прием антиоксидантов в среднем увеличивает коэффициент смертности на 5%! Отдельно витамин Е — на 4%, бета-каротин — на 7%, витамин А — на 16%!

Перепутать причину и следствие очень просто: больше общеукрепляющих средств принимают те люди, которые хуже себя чувствуют, больше болеют и, соответственно, скорее умирают.
avatar
SixSigmaOnline.ru © 2009-2017            Хостинг от uWeb