Корреляция характеризует степень взаимосвязи между случайными величинами. Приведем пример вычисления линейного парного коэффициента корреляции в MS Excel.
Линейный парный коэффициент корреляции обозначают .
В среде электронных таблиц для его вычисления используют функцию КОРРЕЛ(массив1;массив2),
массив1 — это диапазон, в котором расположены значения первой переменной, а массив2 — это диапазон, в котором расположены значения второй переменной.
Свойства линейного парного коэффициента корреляции:
1)
2) если , то связь между переменными — прямая
если , то связь между переменными — обратная
3) если , то связь между переменными — отсутствует
если , то связь между переменными — слабая
если , то связь между переменными — умеренная
если , то связь между переменными — сильная.
Пример. Измерим корреляцию между переменными:
— цена на наушники JBL T100, руб.
— спрос на эти наушники, шт.
Исходная информация представлена в среде электронных таблиц:
Для вычисления линейного парного коэффициента корреляции воспользуемся функцией электронных таблиц, в ячейку D2 вводим выражение =КОРРЕЛ(А2:А16;В2:В16) и нажимаем Enter, получаем результат:
Сделаем вывод: линейная связь между ценой на наушники и спросом на них обратная и очень сильная.
Для наглядного представления связи между переменными построим корреляционное поле с помощью точечной диаграммы.
Для этого выделяем диапазон исходных данных и в меню Вставка выбираем Точечную диаграмму:
Получаем корреляционное поле:
Как видно на рисунке, точки достаточно близко располагаются к некоторой сглаживающей прямой линии. Это как раз и означает, что между переменными сильная линейная связь.