Понятие о корреляции и корреляционном анализе в психологии (стр. 1 из 4)
Определение корелляции — что это
Объясним на примере: существует корреляция между температурой воздуха и потреблением мороженого. Чем жарче погода, тем больше холодного лакомства покупают люди. И наоборот.
Такие закономерности устанавливаются путем исследования больших объемов статистических данных. Собираем информацию о потреблении мороженого за несколько лет и сведения о колебаниях температуры за тот же период. А дальше сопоставляем и ищем зависимость.
При положительной чем больше один параметр, тем больше и другой. Например, чем масштабнее траты фермера на удобрения, тем обильнее урожай. При обратной корреляции рост одной величины сопровождается уменьшением другой. Чем выше здание, тем хуже оно противостоит землетрясениям.
Памятка
- Корреляция – это соотношение, взаимозависимость нескольких переменных.
- Связь бывает положительной и отрицательной.
- Коэффициент корреляции определяет степень взаимозависимости одной переменной от другой.
- На основании корреляции люди выдвигают гипотезы (часто ошибочные).
- Истинная причина корреляции порою скрыта под множеством факторов и внешних сил.
- Бывает ложная корреляционная зависимость.
- Раскладывая яйца по корзинам, помните о том, что они не должны коррелироваться друг с другом.
Удачи вам! До скорых встреч на страницах блога KtoNaNovenkogo.ru
* Нажимая на кнопку «Подписаться» Вы соглашаетесь с политикой конфиденциальности.
Подборки по теме
- Вопросы и ответы
- Использую для заработка
- Полезные онлайн-сервисы
- Описание полезных программ
Использую для заработка
Как при помощи корреляции люди становятся богаче
Главное правило любого инвестора: не класть все яйца в одну корзину. Вложения рекомендуется диверсифицировать (что это?) – распределять. Поэтому люди покупают акции не одной компании, а десятка разных, формируя инвестиционные портфели. Если котировки какой-то фирмы упадут, то оставшиеся девять смогут отыграть падение или хотя бы уменьшить убытки.
Но это в теории, а на практике все портит корреляция. Проблема в том, что стоимости акций разных компаний внутри отрасли или даже всей страны могут сильно коррелировать. Проблемы огромной корпорации провоцируют панику на рынке, снижают стоимость иных активов, на первый взгляд не связанных между собой. В 2008 году случился крах Lehman Brothers, который вызвал цепную реакцию и обвал на мировых рынках.
Например, пара «золото – облигации США» = -0,13. Если собрать портфель из совершенно независимых частей, риски финансовых потерь сократятся.
Территориальное приближение активов друг к другу усиливает корреляцию. Значит, нужно рассматривать варианты в разных точках мира, максимально удаленных друг от друга.
В жизни этот принцип тоже действует. Если ваши навыки и знания позволяют трудиться программистом, таксистом, сантехником и журналистом – вы хорошо защищены от риска безработицы.
Проверка значимости корреляции
Для оценки статистических величин используется понятие их значимости или же достоверности, характеризующей вероятность случайного возникновения величины либо крайних ее значений.
Наиболее распространенным методом определения значимости корреляции является определение критерия Стьюдента.
Его значение сравнивается с табличным, количество степенней свободы принимается как 2. При получении расчетного значения критерия больше табличного, свидетельствует о значимости коэффициента корреляции.
При проведении экономических расчетов достаточным считается доверительный уровень 0,05 (95%) либо 0,01 (99%).
Коэффициент корреляции
Это число, которое обозначается как «r». Оно находится в промежутке от -1 до 1. Отражает силу и полюс взаимосвязи величин. Посмотрим на примере:
Значение коэффициента | Какая корреляция? | О чем это говорит? |
---|---|---|
r=1 | Сильная положительная корреляция | Люди, которые едят чернику, обладают острым зрением. Ешьте чернику! |
r | Слабая положительная корреляция | Некоторые люди, которые любят чернику, обладают острым зрением. Но это не точно. Короче, ничего не пока понятно. Но лучше есть чернику на всякий случай. |
r=0 | Корреляция отсутствует | Черника и зрение никак не связаны. |
r | Слабая отрицательная корреляция | Бывают случаи ухудшения зрения из-за черники. Не стоит рисковать. |
r=-1 | Сильная отрицательная корреляция | Практически все, кто ел чернику, ослепли. Берегитесь черники! |
Величина коэффициента корреляции рассчитывается по формуле:
Если внезапно потемнело в глазах и возникло непреодолимое желание закрыть статью (синдром гуманитария), то есть вариант попроще. Microsoft Exel все выполнит сам при помощи функции «КОРРЕЛ». Делается это так:
Судя по расчетам, рост человека практически никак не влияет на уровень зарплаты.
Ограничения использования коэффициента корреляции
Получение недостоверных данных при расчете коэффициента корреляции возможно в тех случаях, когда:
- в распоряжении имеется достаточное количество значений переменной (25-100 пар наблюдений);
- между изучаемыми переменными установлено, например, квадратичное соотношение, а не линейное;
- в каждом случае данные содержат больше одного наблюдения;
- наличие аномальных значений (выбросов) переменных;
- исследуемые данные состоят из четко выделяемых подгрупп наблюдений;
- наличие корреляционной связи не позволяет установить какая из переменных может рассматриваться в качестве причины, а какая – в качестве следствия.
Корреляционный анализ
Статистический метод, предназначенный для выявления существования зависимости между 2 и более случайными величинами (переменными), а также ее силы, получил название корреляционного анализа.
Получил свое название от correlatio (лат.) – соотношение.
При его использовании возможны варианты развития событий:
- наличие корреляции (положительная либо отрицательная);
- отсутствие корреляции (нулевая).
В случае установления зависимости между переменными речь идет об их коррелировании. Иными словами, можно сказать, что при изменении значения Х, обязательно будет наблюдаться пропорциональное изменение значения У.
В качестве инструментов используются различные меры связи (коэффициенты).
На их выбор оказывает влияние:
- способ измерения случайных чисел;
- характер связи между случайными числами.
Существование корреляционной связи может отображаться графически (графики) и с помощью коэффициента (числовое отображение).
Корреляционная связь характеризуется такими признаками:
- сила связи (при коэффициенте корреляции от ±0,7 до ±1 – сильная; от ±0,3 до ±0,699 – средняя; от 0 до ±0,299 – слабая);
- направление связи (прямая или обратная).
Реальные причины корреляции и возможные гипотезы
Курс доллара и стоимость нефти отрицательно коррелируют. Можем выдвинуть гипотезу: повышение цен на черное золото вызывает падение стоимости американской валюты. Но почему так происходит? Откуда взялась связь между этими явлениями?
Возможно, дело в том, что США – крупнейший потребитель нефти в мире. Каждый день они импортируют около 7,2 миллиона баррелей. Снижение цены на черное золото – хорошо для американской экономики, ведь позволяет тратить меньше денег. Следовательно, доллар растет.
Например, мы выяснили, что существует отрицательная взаимосвязь между доходом персонала и его эффективностью в работе. Наша гипотеза: «Лентяи и бездельники получают больше, чем ответственные сотрудники». Тогда мы пересмотрим систему мотивации и избавимся от бесполезных людей.
Согласно статистике, чем больше пожарных участвует в тушении огня, тем существенней размер ущерба. Какую гипотезу можем сделать отсюда? Пожарные приносят вред, давайте сократим их! Но если разобраться, то настоящая причина повреждения – это огонь. А увеличение числа лиц, задействованных в его тушении, – следствие масштаба пожара.
Наша вселенная бесконечна, а значит всегда можно найти несколько переменных, которые будут коррелировать между собой, несмотря на полное отсутствие причинно-следственных связей. Даже самое буйное воображение не сможет объяснить, что объединяет сыр и одеяло-убийцу:
Более подробно на эту тему смотрите в видео:
Пример корреляции Спирмена
Необходимо установить наличие корреляционной связи между рабочим стажем и показателем травматизма при наличии следующих данных:
Рабочий стаж в годах | Травматизм на 100 работающих |
до 1 года | 24 |
1-2 | 16 |
3-4 | 12 |
5-6 | 12 |
7 и более | 6 |
Наиболее подходящим методом анализа является ранговый метод, т.к. один из признаков представлен в виде открытых вариантов: рабочий стаж до 1 года и рабочий стаж 7 и более лет.
Решение задачи начинается с ранжирования данных, которые сводятся в рабочую таблицу и могут быть выполнены вручную, т.к. их объем не велик:
Рабочий стаж | Число травм | Порядковые номера | (ранги) | Разность рангов | Квадрат разности рангов |
d(х-у) | |||||
до 1 года | 24 | 1 | 5 | -4 | 16 |
1-2 | 16 | 2 | 4 | -2 | 4 |
3-4 | 12 | 3 | 2,5 | +0,5 | 0,25 |
5-6 | 12 | 4 | 2,5 | +1,5 | 2,5 |
7 и более | 6 | 5 | 1 | +4 | 16 |
Σ d2 = 38,5 |
Появление дробных рангов в колонке связано с тем, что в случае появления вариант одинаковых по величине находится среднее арифметическое значение ранга. В данном примере показатель травматизма 12 встречается дважды и ему присваиваются ранги 2 и 3, находим среднее арифметическое этих рангов (2+3)/2= 2,5 и помещаем это значение в рабочую таблицу для 2 показателей. Выполнив подстановку полученных значений в рабочую формулу и произведя несложные расчёты получаем коэффициент Спирмена равный -0,92
Отрицательное значение коэффициента свидетельствует о наличии обратной связи между признаками и позволяет утверждать, что небольшой стаж работы сопровождается большим числом травм. Причем, сила связи этих показателей достаточно большая. Следующим этапом расчётов является определение достоверности полученного коэффициента: • рассчитывается его ошибка и критерий Стьюдента
Применение корреляционного анализа в психологии
Статистическое сопровождение психологических исследований позволяет сделать их более объективными и высоко репрезентативными. Статистическая обработка данных полученных в ходе психологических экспериментов способствует извлечению максимума полезной информации.
Наиболее широкое применение в обработке их результатов получил корреляционный анализ.
https://youtube.com/watch?v=nP5AbDSZqnY
Уместным является проведение корреляционного анализа результатов, полученных при проведении исследований:
- тревожности (по тестам R. Temml, M. Dorca, V. Amen);
- семейных взаимоотношений («Анализ семейных взаимоотношений» (АСВ) опросник Э.Г. Эйдемиллера, В.В. Юстицкиса);
- уровня интернальности-экстернальности (опросник Е.Ф. Бажина, Е.А. Голынкиной и А.М. Эткинда);
- уровня эмоционального выгорания у педагогов (опросник В.В. Бойко);
- связи элементов вербального интеллекта учащихся при разно профильном обучении (методика К.М. Гуревича и др.);
- связи уровня эмпатии (методика В.В. Бойко) и удовлетворенностью браком (опросник В.В. Столина, Т.Л. Романовой, Г.П. Бутенко);
- связи между социометрическим статусом подростков (тест Jacob L. Moreno) и особенностями стиля семейного воспитания (опросник Э.Г. Эйдемиллера, В.В. Юстицкиса);
- структуры жизненных целей подростков, воспитанных в полных и неполных семьях (опросник Edward L. Deci, Richard M. Ryan Ryan).