Розрахунок рангової кореляції. Кореляційний аналіз спірмена, практичний трейдинг у прикладах

Цей калькулятор нижче калькуляторів Spearman's rank correlation coefficient між двома кількома variables. The theoretical part is traditional below the calculator.

add import_export mode_edit delete

Changes of random variables

arrow_upwardarrow_downward arrow_upwardarrow_downward
Items per page: 5 10 20 50 100 chevron_left chevron_right

Changes of random variables

Import data Import error

"Один з наступних характерних рис використовує окремі дані поля: tab, semicolon (;) або comma(,)" Sample: -50.5;-50.5

Import Back Cancel

Digits after the decimal point: 4

Calculate

Spearman's correlation coefficient

Save share extension

Метод методу Spearman's rank correlation coefficient calculation is actually pretty simple. ranking values.

We have only understand what is the rank value and why all this is necessary.

Якщо елементи variational series arranged in ascending or descending order, що rank of the element will be his number in ordered series.

Для прикладу, ми маємо variational series (17,26,5,14,21). Let's sort it's elements in a descending order (26,21,17,14,5). 26 has rank of 1, 21 - rank of 2 and so on, Variational series of ranking values ​​will look like this (3,1,5,4,2).

I.e. Коли калькуляція Spearman's coefficient initial variation series are converted in variational series of ranking values ​​and then Pearson's formula is applied to them.
.
Там є одна загальна величина - ступінь зміни величини є такою, як величина ranks. Це, для серії (17, 15, 14, 15) ranking series буде виглядати як (1, 2.5, 4, 2.5), як перший елемент є 15 ha a rank of 2, and the second - rank of 3, and.

Якщо ви не знайдете значення, що є, всі значення ranking series - numbers between 1 and n, the Pearson's formula can be simplified to

Завжди, ця формула є поставленою гідною як формуляра для визначення Spearman's coefficient.

What is essence of transition from the values ​​themselves to their rank value?
Якщо виявляє кореляцію варіативних цінностей, ви можете зрозуміти, що залежність від двох варіатів є встановлена ​​як монотонна функція.

Зазначення значних показників direction of relationship між variables. Якщо значок є позитивним значенням Y має тенденцію до збільшення X. Якщо sign negative значення Y має тенденцію до зменшення з збільшенням X. Якщо значення не є тенденцією . Якщо коефіцієнт еквівалентів 1 або -1, відносини між X і Y мають appearance monotonic function, i.e. з збільшенням X, Y такожзбільшується і vice versa.

Це є невідомий Pearson's correlation coefficient, який може помітити тільки linear relationship of one variable from another, Spearman's correlation coefficient може detect monotonic dependence, where the directliner relationship cannot be revealed.

Here's an example.
Поясню з прикладу. Let"s suppose,we examine the function y=10/x.
We have the following measurements of X і Y
{{1,10}, {5,2}, {10,1}, {20,0.5}, {100,0.1}}
Для цього data, Pearson correlation coefficient is equal to -0.4686, i.e. the relationship is weak or absent. І Spearman's correlation coefficient є strictly equal to -1, as if it's hints до дослідника, що Y є дуже negative monotonic dependence from X.

Дата публікації: 03.09.2017 13:01

Термін «кореляція» активно використовується у гуманітарних науках, медицині; часто миготить у ЗМІ. Ключову роль кореляції грають у психології. Зокрема, розрахунок кореляцій є важливим етапом реалізації емпіричного дослідження при написанні ВКР з психології.

Матеріали з кореляцій у мережі надто наукові. Нефахівцеві важко розібратися у формулах. У той самий час розуміння сенсу кореляцій необхідне маркетологу, соціологу, медику, психологу - всім, хто проводить дослідження людей.

У цій статті ми простою мовою пояснимо суть кореляційного зв'язку, види кореляцій, способи розрахунку, особливості використання кореляції в психологічних дослідженнях, а також написання дипломних робіт з психології.

Зміст

Що таке кореляція

Кореляція – це зв'язок. Але не будь-яка. У чому її особливість? Розглянемо з прикладу.

Уявіть, що ви їдете автомобілем. Ви натискаєте педаль газу – машина їде швидше. Ви зменшуєте газ - авто сповільнює хід. Навіть не знайома з пристроєм автомобіля людина скаже: «Між педаллю газу та швидкістю машини є прямий зв'язок: чим сильніше натиснута педаль, тим швидкість вища».

Це функціональна залежність - швидкість виступає прямою функцією педалі газу. Фахівець пояснить, що педаль керує подачею палива в циліндри, де відбувається спалювання суміші, що веде до підвищення потужності на вал тощо. Це зв'язок жорсткий, детермінований, що не допускає винятків (за умови, що машина справна).

Тепер уявіть, що ви - директор фірми, співробітники якої продають товари. Ви вирішуєте підвищити продажі за рахунок підвищення окладів працівників. Ви підвищуєте зарплату на 10%, і продаж у середньому по фірмі зростає. Через час підвищуєте ще на 10% і знову зростання. Потім ще на 5% і знову є ефект. Напрошується висновок - між продажами фірми та окладом співробітників є пряма залежність - що вищі оклади, то вищі продажу організації. Такий же це зв'язок, як між педаллю газу та швидкістю авто? У чому ключова відмінність?

Правильно, між окладом та продажами залежність не жорстка. Це означає, що хтось із співробітників продажу міг навіть знизитися, незважаючи на зростання окладу. У когось залишитися незмінними. Але в середньому по фірмі продажі зросли, і ми говоримо – зв'язок продажів та окладу співробітників є, і він кореляційний.

В основі функціонального зв'язку (педаль газу – швидкість) лежить фізичний закон. В основі кореляційного зв'язку (продажу – оклад) знаходиться проста узгодженість зміни двох показників. Жодного закону (у фізичному розумінні цього слова) за кореляцією немає. Є лише ймовірнісна (стохастична) закономірність.

Чисельний вираз кореляційної залежності

Отже, кореляційний зв'язок відбиває залежність між явищами. Якщо ці явища можна виміряти, вона отримує чисельне вираз.

Наприклад, вивчається роль читання у житті людей. Дослідники взяли групу з 40 осіб та виміряли у кожного випробуваного два показники: 1) скільки часу він читає на тиждень; 2) якою мірою вважає себе благополучним (за шкалою від 1 до 10). Вчені занесли ці дані у два стовпчики та за допомогою статистичної програми розрахували кореляцію між читанням та благополуччям. Припустимо, вони одержали наступний результат -0,76. Але що означає це число? Як його проінтерпретувати? Давайте розумітися.

Отримане число називається коефіцієнтом кореляції. Для його правильної інтерпретації важливо враховувати таке:

  1. Знак "+" або "-" відображає напрямок залежності.
  2. Розмір коефіцієнта відбиває силу залежності.

Пряма та зворотна

Знак плюс перед коефіцієнтом свідчить про те, що зв'язок між явищами чи показниками пряма. Тобто чим більше один показник, тим більше й інший. Вище оклад - вищий за продаж. Така кореляція називається прямою, або позитивною.

Якщо коефіцієнт має знак мінус, значить кореляція зворотна, або негативна. У цьому випадку що вищий один показник, то нижчий інший. У прикладі з читанням та благополуччям ми отримали -0,76, і це означає, що чим більше люди читають, тим нижчий рівень їхнього благополуччя.

Сильна та слабка

Кореляційний зв'язок у чисельному вираженні – це число в діапазоні від -1 до +1. Позначається буквою "r". Чим вище число (без урахування знака), тим кореляційний зв'язок сильніший.

Чим нижче чисельне значення коефіцієнта, тим взаємозв'язок між явищами та показниками менший.

Максимально можлива сила залежності – це 1 або -1. Як це зрозуміти та уявити?

Розглянемо приклад. Взяли 10 студентів та виміряли у них рівень інтелекту (IQ) та успішність за семестр. Розташували ці дані у вигляді двох стовпців.

Випробуваний

IQ

Успішність (бали)

Уважно подивіться на дані в таблиці. Від 1 до 10 випробуваного зростає рівень IQ. Але також зростає рівень успішності. З будь-яких двох студентів успішність буде вищою у того, хто має вище IQ. І жодних винятків із цього правила не буде.

Перед нами приклад повної, 100%-но узгодженої зміни двох показників у групі. І це приклад максимально можливого позитивного взаємозв'язку. Тобто кореляційна залежність між інтелектом і успішністю дорівнює 1.

Розглянемо інший приклад. У цих 10-ти студентів за допомогою опитування оцінили, якою мірою вони почуваються успішними у спілкуванні з протилежною статтю (за шкалою від 1 до 10).

Випробуваний

IQ

Успіх у спілкуванні з протилежною статтю (бали)

Дивимося уважно на дані у таблиці. Від 1 до 10 випробуваного зростає рівень IQ. При цьому в останньому стовпці послідовно знижується рівень успішності спілкування з протилежною статтю. З будь-яких двох студентів успіх спілкування з протилежною статтю буде вищим у того, хто має IQ нижче. І жодних винятків із цього правила не буде.

Це приклад повної узгодженості зміни двох показників у групі – максимально можливий негативний взаємозв'язок. Кореляційний зв'язок між IQ та успішністю спілкування з протилежною статтю дорівнює -1.

А як зрозуміти сенс кореляції, що дорівнює нулю (0)? Це означає, що зв'язку між показниками немає. Ще раз повернемося до наших студентів та розглянемо ще один виміряний у них показник – довжину стрибка з місця.

Випробуваний

IQ

Довжина стрибка з місця (м)

Не спостерігається жодної узгодженості між зміною IQ від людини до людини та довгою стрибка. Це свідчить про відсутність кореляції. Коефіцієнт кореляції IQ та довжини стрибка з місця у студентів дорівнює 0.

Ми розглянули крайні випадки. У реальних вимірах коефіцієнти рідко бувають дорівнюють точно 1 або 0. При цьому прийнята наступна шкала:

  • якщо коефіцієнт більше 0,70 – зв'язок між показниками сильний;
  • від 0,30 до 0,70 - зв'язок помірний,
  • менше 0,30 - зв'язок слабкий.

Якщо оцінити за цією шкалою отриману нами вище кореляцію між читанням та благополуччям, то виявиться, що ця залежність сильна та негативна -0,76. Тобто спостерігається сильний негативний зв'язок між начитаністю та благополуччям. Що ще раз підтверджує біблійну мудрість про співвідношення мудрості та смутку.

Наведена градація дає дуже приблизні оцінки й у вигляді рідко використовуються у дослідженнях.

Найчастіше використовуються градації коефіцієнтів за рівнями значимості. І тут реально отриманий коефіцієнт може бути значним чи значимим. Визначити це можна, порівнявши його значення із критичним значенням коефіцієнта кореляції, взятим із спеціальної таблиці. Причому ці критичні значення залежать від чисельності вибірки (що більший обсяг, то нижче критичне значення).

Кореляційний аналіз у психології

Кореляційний метод виступає одним із основних у психологічних дослідженнях. І це невипадково, адже психологія прагне бути точною наукою. Чи виходить?

У чому особливість законів у точних науках. Наприклад, закон тяжіння у фізиці діє без винятків: що більше маса тіла, то сильніше воно притягує інші тіла. Цей фізичний закон відображає зв'язок маси тіла та сили тяжіння.

У психології інша ситуація. Наприклад, психологи публікують дані про зв'язок теплих відносин у дитинстві з батьками та рівня креативності у дорослому віці. Чи означає це, що кожен із піддослідних з дуже теплими стосунками з батьками у дитинстві матиме дуже високі творчі здібності? Відповідь однозначна – ні. Тут немає закону, подібного до фізичного. Немає механізму впливу дитячого досвіду на креативність дорослих. Це наші фантазії! Є узгодженість даних (відносини – креативність), але за ними немає закону. А є лише кореляційний зв'язок. Психологи часто називають взаємозв'язки, що виявляються психологічними закономірностями, підкреслюючи їх імовірнісний характер - не жорсткість.

Приклад дослідження на студентах із попереднього розділу добре ілюструє використання кореляцій у психології:

  1. Аналіз взаємозв'язку між психологічними показниками. У нашому прикладі IQ та успішність спілкування з протилежною статтю – це психологічні параметри. Виявлення кореляції між ними розширює уявлення про психічну організацію людини, про взаємозв'язки між різними сторонами її особистості - у разі між інтелектом і сферою спілкування.
  2. Аналіз взаємозв'язків IQ з успішністю та стрибками - приклад зв'язку психологічного параметра з непсихологічними. Отримані результати розкривають особливості впливу інтелекту на навчальну та спортивну діяльність.

Ось як могли виглядати короткі висновки щодо результатів вигаданого дослідження на студентах:

  1. Виявлено значну позитивну залежність інтелекту студентів та їх успішності.
  2. Існує негативна значуща взаємозв'язок IQ з успішністю спілкування з протилежною статтю.
  3. Не виявлено зв'язку IQ студентів із вмінням стрибати з місця.

Таким чином, рівень інтелекту студентів виступає позитивним фактором їх академічної успішності, в той же час негативно позначається на відносинах з протилежною статтю і не надаючи значного впливу на спортивні успіхи, зокрема, здатність стрибати з місця.

Як бачимо, інтелект допомагає студентам навчатися, але заважає будувати стосунки із протилежною статтю. При цьому не впливає на їхні спортивні успіхи.

Неоднозначний вплив інтелекту на особистість та діяльність студентів відображає складність цього феномена у структурі особистісних особливостей та важливість продовження досліджень у цьому напрямі. Зокрема, є важливим провести аналіз взаємозв'язків інтелекту з психологічними особливостями та діяльністю студентів з урахуванням їхньої статі.

Коефіцієнти Пірсона та Спірмена

Розглянемо два методи розрахунку.

p align="justify"> Коефіцієнт Пірсона - це особливий метод розрахунку взаємозв'язку показників між вираженістю чисельних значень в одній групі. Дуже спрощено він зводиться до наступного:

  1. Беруться значення двох параметрів у групі випробуваних (наприклад, агресії та перфекціонізму).
  2. Знаходяться середні значення кожного параметра групи.
  3. Знаходяться різниці параметрів кожного випробуваного та середнього значення.
  4. Ці різниці підставляються у спеціальну форму для розрахунку коефіцієнта Пірсона.

Коефіцієнт рангової кореляції Спірмена розраховується таким чином:

  1. Беруться значення двох індикаторів групи піддослідних.
  2. Знаходяться ранги кожного чинника групи, тобто місце у списку зростання.
  3. Знаходяться різниці рангів, зводяться квадрат і підсумовуються.
  4. Далі різниці рангів підставляються у спеціальну форму для обчислення коефіцієнта Спірмена.

У разі Пірсона розрахунок йшов із використанням середнього значення. Отже, випадкові викиди даних (істотна відмінність від середнього), наприклад, через помилку обробки або недостовірних відповідей можуть суттєво спотворити результат.

У випадку Спірмена абсолютні значення даних не відіграють ролі, тому що враховується лише їхнє взаємне розташування по відношенню один до одного (ранги). Тобто викиди даних або інші неточності не вплинуть на кінцевий результат.

Якщо результати тестування коректні, відмінності коефіцієнтів Пірсона і Спірмена незначні, причому коефіцієнт Пірсона показує більш точне значення взаємозв'язку даних.

Як розрахувати коефіцієнт кореляції

Коефіцієнти Пірсона та Спірмена можна розрахувати вручну. Це може знадобитись при поглибленому вивченні статистичних методів.

Однак у більшості випадків під час вирішення прикладних завдань, зокрема й у психології, можна проводити розрахунки з допомогою спеціальних програм.

Розрахунок за допомогою електронних таблиць Microsoft Excel

Повернемося знову наприклад зі студентами і розглянемо дані про рівень їхнього інтелекту та довжину стрибка з місця. Занесемо ці дані (два стовпці) до таблиці Excel.

Перемістивши курсор у порожню комірку, натиснемо опцію «Вставити функцію» та виберемо «КОРРЕЛ» з розділу «Статистичні».

Формат цієї функції передбачає виділення двох масивів даних: Корел (масив 1; масив »). Виділяємо відповідно стовпчик з IQ та довжиною стрибків.

У таблицях Excel реалізовано формулу розрахунку лише коефіцієнта Пірсона.

Розрахунок за допомогою програми STATISTICA

Заносимо дані по інтелекту та довжині стрибка у полі вихідних даних. Далі вибираємо опцію "Непараметричні критерії", "Спірмена". Виділяємо параметри для розрахунку та отримуємо наступний результат.


Як видно, розрахунок дав результат 0,024, що відрізняється від результату Пірсона - 0,038, отриманої вище за допомогою Excel. Проте відмінності незначні.

Використання кореляційного аналізу у дипломних роботах з психології (приклад)

Більшість тем випускних кваліфікаційних робіт з психології (дипломів, курсових, магістерських) передбачають проведення кореляційного дослідження (інші пов'язані з виявленням відмінностей психологічних показників у різних групах).

Сам термін «кореляція» у назвах тем звучить рідко – він ховається за такими формулюваннями:

  • «Взаємозв'язок суб'єктивного відчуття самотності та самоактуалізації у жінок зрілого віку»;
  • «Особливості впливу життєстійкості менеджерів на успішність їхньої взаємодії з клієнтами у конфліктних ситуаціях»;
  • «Особистісні фактори стресостійкості співробітників МНС».

Отже, слова «взаємозв'язок», «вплив» і «чинники» - вірні ознаки те, що шляхом аналізу даних у емпіричному дослідженні може бути кореляційний аналіз.

Розглянемо коротко етапи його проведення під час написання дипломної роботи з психології на тему: «Взаємозв'язок особистісної тривожності та агресивності у підлітків».

1. Для розрахунку необхідні сирі дані, як яких зазвичай виступають результати тестування піддослідних. Вони заносяться до зведеної таблиці і поміщаються у додаток. Ця таблиця влаштована так:

  • кожен рядок містить дані на одного випробуваного;
  • кожен стовпець містить показники за однією шкалою всім випробуваних.

№ випробуваного

Особистісна тривожність

Агресивність

2. Необхідно вирішити, який із двох типів коефіцієнтів - Пірсона або Спірмена - використовуватиметься. Нагадуємо, що Пірсон дає більш точний результат, але він чутливий до викидів у даних. Коефіцієнти Спірмена можуть використовуватися з будь-якими даними (крім номінативної шкали), тому саме вони найчастіше використовують у дипломах психології.

3. Заносимо таблицю сирих даних у статистичну програму.

4. Розраховуємо значення.



5. На наступному етапі важливо визначити, чи важливий взаємозв'язок. Статистична програма підсвітила результати червоним, що означає, що кореляція статистично значущі за рівня значущості 0,05 (зазначено вище).

Однак, корисно знати, як визначити значущість вручну. І тому знадобиться таблиця критичних значень Спірмена.

Таблиця критичних значень коефіцієнтів Спірмена

Рівень статистичної значимості

Число випробуваних

р = 0,05

р = 0,01

р = 0,001

0,88

0,96

0,99

0,81

0,92

0,97

0,75

0,88

0,95

0,71

0,83

0,93

0,67

0,63

0,77

0,87

0,74

0,85

0,58

0,71

0,82

0,55

0,68

0,53

0,66

0,78

0,51

0,64

0,76

Нас цікавить рівень значущості 0,05 та обсяг нашої вибірки 10 осіб. На перетині цих даних знаходимо значення критичного Спірмена: Rкр = 0,63.

Правило таке: якщо отримане емпіричне значення Спірмена більше чи одно критичному, він статистично значимий. У нашому випадку: Rемп (0,66) > Rкр (0,63), отже, взаємозв'язок між агресивністю і тривожністю групи підлітків статистично значуща.

5. У текст дипломної потрібно вставляти дані у таблиці формату word, а чи не таблицю зі статистичної програми. Під таблицею описуємо отриманий результат та інтерпретуємо його.

Таблиця 1

Коефіцієнти Спірмена агресивності та тривожності у групі підлітків

Агресивність

Особистісна тривожність

0,665*

* - статистично достовірна (р0,05)

Аналіз даних, наведених у таблиці 1, показує, що існує статистично значущий позитивний зв'язок між агресивністю та тривожністю підлітків. Це означає, що чим вище особистісна тривожність підлітків, тим вищий рівень їхньої агресивності. Такий результат дає підстави припустити, що агресія для підлітків виступає одним із способів усунення тривожності. Зазнаючи невпевненості у собі, тривогу у зв'язку з загрозами самооцінці, особливо чутливої ​​у підлітковому віці, підліток часто використовує агресивну поведінку, таким непродуктивним способом знижуючи тривогу.

6. Чи можна говорити про вплив при інтерпретації зв'язків? Чи можна сказати, що тривожність впливає агресивність? Строго кажучи, ні. Вище ми показали, що кореляційна зв'язок між явищами носить імовірнісний характері і відбиває лише узгодженість змін ознак групи. При цьому ми не можемо сказати, що ця узгодженість викликана тим, що одне з явищ є причиною іншого, що впливає на нього. Тобто наявність кореляції між психологічними параметрами не дає підстав говорити про існування між ними причинно-наслідкового зв'язку. Однак практика показує, що термін «вплив» часто використовується під час аналізу результатів кореляційного аналізу.

Студента-психолога (соціолога, менеджера, управлінця та інших.) нерідко цікавить, як пов'язані між собою дві чи більше змінних у однієї чи кількох досліджуваних групах.

У математиці для опису зв'язків між змінними величинами використовують поняття функції F, яка ставить у відповідність кожному певному значенню незалежної змінної X певне значення залежної змінної Y. Отримана залежність позначається як Y=F(X).

При цьому види кореляційних зв'язків між виміряними ознаками можуть бути різні: так, кореляція буває лінійною та нелінійною, позитивною та негативною. Вона лінійна - якщо зі збільшенням або зменшенням однієї змінної X, друга змінна Y в середньому або також зростає, або зменшується. Вона нелінійна, якщо зі збільшенням однієї величини характер зміни другий не лінійний, а описується іншими законами.

Кореляція буде позитивною, якщо зі збільшенням змінної X змінна Y в середньому також збільшується, а якщо зі збільшенням X змінна Y має середньому тенденцію до зменшення, то говорять про наявність негативної кореляції. Можлива ситуація, коли між змінними неможливо встановити будь-яку залежність. І тут говорять про відсутність кореляційного зв'язку.

Завдання кореляційного аналізу зводиться до встановлення напряму (позитивне або негативне) і форми (лінійний, нелінійний) зв'язок між варіюючими ознаками, вимірювання її тісноти, і, нарешті, до перевірки рівня значущості отриманих коефіцієнтів кореляції.

Коефіцієнт кореляції рангів, запропонований К. Спірменом, відноситься до непараметричних показників зв'язку між змінними, виміряними в ранговій шкалі. При розрахунку цього коефіцієнта не потрібно ніяких припущень про характер розподілу ознак у генеральній сукупності. Цей коефіцієнт визначає ступінь тісноти зв'язку порядкових ознак, які у разі є ранги порівнюваних величин.

Ранговий коефіцієнт лінійної кореляції Спірмена підраховується за такою формулою:

де n - кількість ранжованих ознак (показників, випробуваних);
D - різниця між рангами по двох змінних для кожного випробуваного;
D2 – сума квадратів різниць рангів.

Критичні значення коефіцієнта кореляції рангів Спірмена представлені нижче:

Розмір коефіцієнта лінійної кореляції Спірмена лежить в інтервалі +1 і -1. Коефіцієнт лінійної кореляції Спірмена може бути позитивним та негативним, характеризуючи спрямованість зв'язку між двома ознаками, виміряними в ранговій шкалі.

Якщо коефіцієнт кореляції по модулю виявляється близьким до 1, це відповідає високому рівню зв'язку між змінними. Так, зокрема, при кореляції змінної величини із самою собою величина коефіцієнта кореляції дорівнюватиме +1. Такий зв'язок характеризує прямо пропорційну залежність. Якщо значення змінної X будуть розташовані в порядку зростання, а ті ж значення (позначені тепер вже як змінна Y) будуть розташовуватися в порядку спадання, то в цьому випадку кореляція між змінними Х і Y дорівнюватиме точно -1. Така величина коефіцієнта кореляції характеризує обернено пропорційну залежність.

Знак коефіцієнта кореляції дуже важливий для інтерпретації отриманого зв'язку. Якщо знак коефіцієнта лінійної кореляції - плюс, то зв'язок між корелюючими ознаками така, що більшій величині однієї ознаки (змінної) відповідає велика величина іншої ознаки (іншої змінної). Іншими словами, якщо один показник (змінна) збільшується, то відповідно збільшується й інший показник (змінна). Така залежність зветься прямо пропорційної залежності.

Якщо ж отримано знак мінус, більшій величині однієї ознаки відповідає менша величина іншого. Інакше висловлюючись, за наявності знака мінус, збільшення однієї змінної (ознака, значення) відповідає зменшення інший змінної. Така залежність носить назву обернено пропорційної залежності. У цьому вибір змінної, якій приписується характер (тенденція) зростання - довільний. Це може бути як змінна X, так і змінна Y. Однак якщо вважається, що збільшується змінна X, то змінна Y відповідно зменшуватиметься, і навпаки.

Розглянемо приклад кореляції Спірмена.

Психолог з'ясовує, як пов'язані між собою індивідуальні показники готовності до школи, отримані до початку навчання у школі у 11 першокласників та їхня середня успішність наприкінці навчального року.

Для вирішення цього завдання було проранжовано, по-перше, значення показників шкільної готовності, отримані під час вступу до школи, і, по-друге, підсумкові показники успішності наприкінці року в тих учнів у середньому. Результати подаємо у таблиці:

Підставляємо отримані дані у наведену вище формулу, і проводимо розрахунок. Отримуємо:

Для знаходження рівня значущості звертаємося до таблиці "Критичні значення коефіцієнта кореляції рангів Спірмена", в якій наведено критичні значення для коефіцієнтів рангової кореляції.

Будуємо відповідну «вісь значущості»:

Отриманий коефіцієнт кореляції збігся з критичним значенням рівня значимості в 1%. Отже, можна стверджувати, що показники шкільної готовності та підсумкові оцінки першокласників пов'язані позитивною кореляційною залежністю - інакше кажучи, чим вищий показник шкільної готовності, тим краще навчається першокласник. У термінах статистичних гіпотез психолог повинен відхилити нульову (Н0) гіпотезу про подібність і прийняти альтернативну (Н1) про наявність відмінностей, яка говорить про те, що зв'язок між показниками шкільної готовності та середньою успішністю відрізняється від нуля.

Кореляція спірмена. Кореляційний аналіз методом спірмена. Ранги спірмена. Коефіцієнт кореляції Спірмена. Рангова кореляція Спірмена

Насправді визначення тісноти зв'язку двох ознак часто застосовується коефіцієнт рангової кореляції Спірмена (Р). Значення кожної ознаки ранжуються за ступенем зростання (від 1 до n), потім визначається різниця (d) між рангами, які відповідають одному спостереженню.

Приклад №1. Залежність між обсягом промислової продукції та інвестиціями в основний капітал по 10 областях одного з федеральних округів РФ у 2003 році характеризується такими даними.
Обчисліть рангові коефіцієнти кореляції Спірменаі Кендела. Перевірити їх значення при α=0,05. Сформулюйте висновок про залежність між обсягом промислової продукції та інвестиціями в основний капітал за аналізованими областями РФ.

Надамо ранги ознакою Y і фактору X . Знайдемо суму різниці квадратів d 2 .
Використовуючи калькулятор, обчислимо коефіцієнт рангової кореляції Спірмена:

X Y ранг X, d x ранг Y, d y (d x - d y) 2
1.3 300 1 2 1
1.8 1335 2 12 100
2.4 250 3 1 4
3.4 946 4 8 16
4.8 670 5 7 4
5.1 400 6 4 4
6.3 380 7 3 16
7.5 450 8 5 9
7.8 500 9 6 9
17.5 1582 10 16 36
18.3 1216 11 9 4
22.5 1435 12 14 4
24.9 1445 13 15 4
25.8 1820 14 19 25
28.5 1246 15 10 25
33.4 1435 16 14 4
42.4 1800 17 18 1
45 1360 18 13 25
50.4 1256 19 11 64
54.8 1700 20 17 9
364

Зв'язок між ознакою Y фактором X сильний і прямий.

Оцінка коефіцієнта рангової кореляції Спірмена



По таблиці Стьюдента знаходимо Tтабл.
T табл = (18; 0.05) = 1.734
Оскільки Tнабл > Tтабл, то відхиляємо гіпотезу про рівність нулю коефіцієнта рангової кореляції. Інакше кажучи, коефіцієнта рангової кореляції Спірмена статистично - значущий.

Інтервальна оцінка для коефіцієнта рангової кореляції (довірчий інтервал)
Довірчий інтервалдля коефіцієнта рангової кореляції Спірмена: p (0.5431; 0.9095).

Приклад №2. Вихідні дані.

5 4
3 4
1 3
3 1
6 6
2 2
Так як у матриці є пов'язані ранги (однаковий ранговий номер) 1-го ряду, зробимо їх переформування. Переформування рангів здійснюватиметься без зміни важливості рангу, тобто між ранговими номерами повинні зберегтися відповідні співвідношення (більше, менше або рівно). Також не рекомендується ставити ранг вище 1 і нижче значення, що дорівнює кількості параметрів (в даному випадку n = 6). Переформування рангів провадиться в табл.
Нові ранги
1 1 1
2 2 2
3 3 3.5
4 3 3.5
5 5 5
6 6 6
Так як у матриці є пов'язані ранги 2-го ряду, зробимо їх переформування. Переформування рангів провадиться в табл.
Номери місць у впорядкованому рядіРозташування факторів оцінки експертаНові ранги
1 1 1
2 2 2
3 3 3
4 4 4.5
5 4 4.5
6 6 6
Матриця рангів.
ранг X, d xранг Y, d y(d x - d y) 2
5 4.5 0.25
3.5 4.5 1
1 3 4
3.5 1 6.25
6 6 0
2 2 0
21 21 11.5
Оскільки серед значень ознак х і зустрічається кілька однакових, тобто. утворюються пов'язані ранги, то у такому разі коефіцієнт Спірмена обчислюється як:

де


j – номери зв'язок по порядку для ознаки х;
А j - число однакових рангів у j-й зв'язці х;
k – номери зв'язок по порядку для ознаки у;
У k - число однакових рангів у k-й зв'язці з у.
A = [(2 3 -2)]/12 = 0.5
B = [(2 3 -2)]/12 = 0.5
D = A + B = 0.5 + 0.5 = 1

Зв'язок між ознакою Y та фактором X помірна та пряма. - це кількісна оцінка статистичного вивчення зв'язку між явищами, що використовується у непараметричних методах.

Показник показує, як відрізняється отримана під час спостереження сума квадратів різниць між рангами від відсутності зв'язку.

Призначення сервісу. За допомогою цього онлайн-калькулятора проводиться:

  • розрахунок коефіцієнта рангової кореляції Спірмена;
  • обчислення довірчого інтервалу для коефіцієнта та оцінка його значущості;

Коефіцієнт рангової кореляції Спірменавідноситься до показників оцінки тісноти зв'язку. Якісну характеристику тісноти зв'язку коефіцієнта рангової кореляції, як та інших коефіцієнтів кореляції, можна оцінити за шкалою Чеддока.

Розрахунок коефіцієнтаскладається з наступних етапів:

Властивості коефіцієнта рангової кореляції Спірмена

Область застосування. Коефіцієнт кореляції рангіввикористовується з метою оцінки якості зв'язку між двома сукупностями. Крім цього, його статистична значимість застосовується при аналізі даних на гетероскедастичність.

Приклад. За вибіркою даних змінних X і Y, що спостерігаються:

  1. скласти рангову таблицю;
  2. знайти коефіцієнт рангової кореляції Спірмена та перевірити його значущість на рівні 2a
  3. оцінити характер залежності
Рішення. Надамо ранги ознакою Y і фактору X .
XYранг X, d xранг Y, d y
28 21 1 1
30 25 2 2
36 29 4 3
40 31 5 4
30 32 3 5
46 34 6 6
56 35 8 7
54 38 7 8
60 39 10 9
56 41 9 10
60 42 11 11
68 44 12 12
70 46 13 13
76 50 14 14

Матриця рангів.
ранг X, d xранг Y, d y(d x - d y) 2
1 1 0
2 2 0
4 3 1
5 4 1
3 5 4
6 6 0
8 7 1
7 8 1
10 9 1
9 10 1
11 11 0
12 12 0
13 13 0
14 14 0
105 105 10

Перевірка правильності складання матриці на основі обчислення контрольної суми:

Сума по стовпчиках матриці рівні між собою та контрольної суми, отже, матриця складена правильно.
За формулою обчислимо коефіцієнт рангової кореляції Спірмена.


Зв'язок між ознакою Y та фактором X сильний і прямий
Значення коефіцієнта рангової кореляції Спірмена
Для того щоб при рівні значимості α перевірити нульову гіпотезу про рівність нулю генерального коефіцієнта рангової кореляції Спірмена при гіпотезі конкуруючої H i . p ≠ 0, треба обчислити критичну точку:

де n – обсяг вибірки; ρ - вибірковий коефіцієнт рангової кореляції Спірмена: t(α, к) - критична точка двосторонньої критичної області, яку знаходять за таблицею критичних точок розподілу Стьюдента, за рівнем значущості α та числом ступенів свободи k = n-2.
Якщо |p|< Т kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| >T kp – нульову гіпотезу відкидають. Між якісними ознаками існує значний ранговий кореляційний зв'язок.
За таблицею Стьюдента знаходимо t(α/2, k) = (0.1/2; 12) = 1.782

Оскільки T kp< ρ , то отклоняем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - значим и ранговая корреляционная связь между оценками по двум тестам значимая.