Як порахувати кореляцію

Кореляцією називають взаємну залежність двох випадкових величин (частіше - двох груп величин), при якій зміна однієї з них призводить і до зміни іншої. Коефіцієнт кореляції показує, наскільки ймовірно зміна другої величини при зміні значень першої, тобто ступінь її залежності. Найпростіший спосіб обчислення цієї величини - скористатися відповідною функцією, вбудованої в табличний редактор Microsoft Office Excel.
Як порахувати кореляцію

Вам знадобиться

  • Табличний редактор Microsoft Office Excel.

Інструкція

1
Запустіть Excel і відкрийте документ, який містить групи даних, коефіцієнт кореляції між якими потрібно обчислити. Якщо такого документа ще не створено, то введіть дані в порожню таблицю - табличний редактор створює її автоматично при запуску програми. Кожну з груп значень, кореляція між якими вас цікавить, вводите в окрему колонку. Це не обов`язково повинні бути сусідні колонки, ви вільні оформити таблицю до Ваших потреб - додати додаткові стовпці з поясненнями до даних, заголовки колонок, підсумкові комірки з сумарними або середніми значеннями і т.д. Можна навіть розташовувати дані не в вертикальному (в колонках), а в горизонтальному (в рядках) напрямку. Єдина вимога, яку треба дотримуватися - осередки з даними кожної групи повинні розташовуватися послідовно одна за одною, щоб таким чином створювався безперервний масив.
2
Перейдіть в клітинку, яка повинна буде містити значення кореляції даних двох масивів, і клікніть в меню Excel закладку «Формули». У групі команд «Бібліотека функцій» клацніть по найостаннішої піктограмі - «Інші функції». Відкриється список, що випадає, в якому вам слід перейти в розділ «Статистичні» і вибрати функцію КОРРЕЛ. В результаті відкриється вікно майстра функцій з формою, призначеної для заповнення. Це ж вікно можна викликати і без вкладки «Формули», просто клацнувши по піктограмі вставки функції, розміщеної лівіше рядки формул.
3
Вкажіть першу групу корелюють даних в поле «массів1» майстра формул. Щоб ввести діапазон комірок вручну наберіть адресу першої і останньої клітин, розділивши їх двокрапкою (без пробілів). Інший варіант - просто виділіть потрібний діапазон мишкою, а потрібний запис в це поле форми Excel помістить самостійно. Таку ж операцію треба виконати і з другою групою даних в поле «массів2».


4
Натисніть кнопку OK. Табличний редактор розрахує і відобразить значення кореляції в осередку з формулою. При необхідності ви можете зберегти цей документ для подальшого використання (поєднання клавіш Ctrl + S).

Рада 2: Як розрахувати коефіцієнт кореляції

За визначенням, коефіцієнтом кореляції (нормованим кореляційним моментом) називається відношення кореляційного моменту системи двох випадкових величин (ССВ) до його максимального значення. Для того щоб розібратися в суті цього питання, необхідно, перш за все, познайомитися з поняттям кореляційного моменту.
Як розрахувати коефіцієнт кореляції

Вам знадобиться

  • - папір;
  • - ручка.

Інструкція

1
Визначення: Кореляційним моментом ССВ X і Y називається змішаний центральний момент другого порядку (див. Рис.1)
Тут W (x, y) - спільна щільність ймовірності ССВ
Кореляційний момент є характеристикою: а) взаємного розкиду значень ССВ щодо точки середніх значень або математичних очікувань (mx, my) - б) ступеня лінійного зв`язку між СВ Х і Y.
Як розрахувати коефіцієнт кореляції



2
Властивості кореляційного моменту.
1. R (xy) = R (yx) - з визначення.
2. Rxx = Dx (дисперсії) - з визначення.
3. Для незалежних Х і Y R (xy) = 0.
Дійсно, при цьому M {Xц, Yц} = M {Xц} M {Yц} = 0. В даному випадку це відсутність лінійного зв`язку, але не будь-який, а, скажімо, квадратичної.
4. При наявності «жорсткої лінійного зв`язку між X і Y, Y = aX + b - | R (xy) | = бxбy = max.
5. -бxбy R (xy) бxбy.
3
Тепер повернемося до розгляду коефіцієнта кореляції r (xy), сенс якого полягає в лінійного зв`язку між СВ. Його значення змінюється від -1 до 1, крім того він не володіє розмірністю. У відповідності зі сказаним, можна записати:
R (xy) = R (xy) / бxбy (1)
4
Для пояснення сенсу нормованого кореляційного моменту, уявіть собі, що отримані дослідним шляхом значення СВ Х і Y є координатами точки на площині. При наявності «жорсткої» лінійного зв`язку ці точки в точності ляжуть на пряму лінію Y = aX + b. Возьмтіе тільки позитивні значення кореляції (при а
Як розрахувати коефіцієнт кореляції
5
При r (xy) = 0 всі отримані точки виявляться всередині еліпса з центром в (mx, my), величина піввісь якого визначається значеннями дисперсій СВ.
На цьому питання про розрахунок r (xy), здавалося б, можна вважати вичерпаним (див. Формулу (1)). Проблема полягає в тому, що дослідник, який отримав значення СВ експериментально, не може на всі 100% знати щільність ймовірності W (x, y). Тому краще вважати, що в поставленому завданню розглядаються вибіркові значення СВ (тобто отриманими в досвіді), і використовувати оцінки потрібних величин. тоді оцінка
mx * = (1 / n) (x1 + x2 + ... + xn) (для СВ Y аналогічно). Dx * = (1 / (n-1)) ((x1- mx *) ^ 2 + (x2- mx *) ^ 2 + ...
+(Xn- mx *) ^ 2). R * x = (1 / (n-1)) ((x1- mx *) (y1- my *) + (x2- mx *) (y2- my *) + ... + (xn- mx *) (yn - my *)). бx * = sqrtDx (то ж для СВ Y).
Тепер можна сміливо для оцінок використовувати формулу (1).


Увага, тільки СЬОГОДНІ!


Оцініть, будь ласка статтю
Всього голосів: 59
Увага, тільки СЬОГОДНІ!