Какво е корелация в статистиката. Коефициентът на корелация е характеристика на корелационния модел. Как да интерпретираме стойността на корелационния коефициент на Пиърсън
" Статистика
Статистика и обработка на данни в психологията
(продължение)
Корелационен анализ
При учене корелацииопитайте се да установите дали има връзка между два показателя в една и съща извадка (например между височината и теглото на децата или между нивото IQи училищни постижения) или между две различни извадки (например при сравняване на двойки близнаци), и ако тази връзка съществува, дали увеличението на един показател е придружено от увеличение (положителна корелация) или намаление (отрицателна корелация) на друго.
С други думи, корелационният анализ помага да се установи дали е възможно да се предвидят възможните стойности на един индикатор, като се знае стойността на друг.
Досега, когато анализирахме резултатите от нашия опит в изучаването на ефектите на марихуаната, съзнателно пренебрегвахме такъв показател като времето за реакция. Междувременно би било интересно да се провери дали има връзка между ефективността на реакциите и тяхната скорост. Това би позволило например да се твърди, че колкото по-бавен е човек, толкова по-точни и ефективни ще бъдат неговите действия и обратното.
За тази цел могат да се използват два различни метода: параметричният метод за изчисляване на коефициента на Bravais-Pearson (r) и изчисляването на коефициента на рангова корелация на Spearman (r s), който се прилага към ординални данни, т.е. е непараметричен. Нека обаче първо разберем какво е коефициент на корелация.
Коефициент на корелация
Коефициентът на корелация е стойност, която може да варира от +1 до -1. В случай на пълна положителна корелация този коефициент е равен на плюс 1, а в случай на пълна отрицателна корелация е минус 1. На графиката това съответства на права линия, минаваща през точките на пресичане на стойности на всяка двойка данни:
Ако тези точки не се подредят в права линия, а образуват „облак“, абсолютната стойност на корелационния коефициент става по-малка от единица и се доближава до нула, когато облакът се закръгля:
Ако коефициентът на корелация е 0, двете променливи са напълно независими една от друга.
В хуманитарните науки една корелация се счита за силна, ако нейният коефициент е по-голям от 0,60; ако надвишава 0,90, тогава корелацията се счита за много силна. Въпреки това, за да можем да направим заключения относно връзките между променливите, големината на извадката е от голямо значение: колкото по-голяма е извадката, толкова по-надеждна е стойността на получения корелационен коефициент. Има таблици с критични стойности на корелационните коефициенти на Bravais-Pearson и Spearman за различен брой степени на свобода (той е равен на броя на двойките минус 2, т.е. н- 2). Само ако коефициентите на корелация са по-големи от тези критични стойности, те могат да се считат за надеждни. Така че, за да бъде надежден коефициентът на корелация от 0,70, в анализа трябва да бъдат взети поне 8 двойки данни (ч =n-2=6) при изчисляване на r (вижте Таблица 4 в Приложението) и 7 двойки данни (h = n-2= 5) при изчисляване на r s (Таблица 5 в Приложението).
Бих искал още веднъж да подчертая, че същността на тези два коефициента е малко по-различна. Отрицателният коефициент r показва, че ефективността най-често е толкова по-висока, колкото по-бързо е времето за реакция, докато при изчисляването на коефициента r s е необходимо да се провери дали по-бързите субекти винаги реагират по-точно, а по-бавните субекти по-малко точно.
Коефициент на корелация на Bravais-Pearson (r) - Това е параметричен индикатор, за изчисляването на който се сравняват средните и стандартните отклонения на резултатите от две измервания. В този случай се използва формула (може да изглежда различно за различните автори)
където Σ XY-сумата от произведенията на данните от всяка двойка;
n е броят на двойките;
X - средно за дадена променлива х;
Y -
средно за променливи данни Y
Sx-стандартно отклонение за разпределение Х;
Си-стандартно отклонение за разпределение при
Коефициент на рангова корелация на Спирман ( rs ) - това е непараметричен индикатор, с помощта на който се опитват да разкрият връзката между редиците на съответните количества в две серии от измервания.
Този коефициент е по-лесен за изчисляване, но резултатите са по-малко точни от използването на r. Това се дължи на факта, че при изчисляване на коефициента на Спирман се използва редът на данните, а не техните количествени характеристики и интервали между класовете.
Факт е, че когато се използва коефициентът на корелация на ранговете на Спирман (r s), те проверяват само дали класирането на данните за всяка извадка ще бъде същото като в поредица от други данни за тази извадка, свързани по двойки с първата (например , дали ще бъдат едни и същи „класирани” от ученици както по психология, така и по математика, или дори с двама различни учители по психология?). Ако коефициентът е близо до +1, това означава, че и двете серии практически съвпадат, а ако този коефициент е близо до -1, можем да говорим за пълна обратна зависимост.
Коефициент rsизчислено по формулата
където де разликата между редиците на стойностите на конюгирани признаци (независимо от неговия знак) и е броят на двойките.
Обикновено този непараметричен тест се използва в случаите, когато трябва да направите някои заключения не толкова за интервалимежду данните, колко за тях редици,а също и когато кривите на разпределение са твърде изкривени и не позволяват използването на параметрични критерии като коефициента r (в тези случаи може да се наложи количествените данни да се превърнат в редови данни).
Резюме
И така, ние разгледахме различни параметрични и непараметрични статистически методи, използвани в психологията. Нашата рецензия беше много повърхностна и основната й задача беше да накара читателя да разбере, че статистиката не е толкова страшна, колкото изглежда, и изисква най-вече здрав разум. Напомняме ви, че данните за "стажа", с които работихме тук, са фиктивни и не могат да служат като основа за каквито и да е изводи. Такъв експеримент обаче би си струвало да се направи. Тъй като за този експеримент е избрана чисто класическа техника, един и същ статистически анализ може да се използва в много различни експерименти. Във всеки случай, струва ни се, че сме очертали някои основни насоки, които могат да бъдат полезни за тези, които не знаят откъде да започнат статистическия анализ на резултатите.
Литература
- Годфроа Дж.Какво е психология. - М., 1992.
- Шатийон Г., 1977. Statistique en Sciences humaines, Trois-Rivieres, Ed. SMG.
- Гилбърт Н. 1978. Statistiques, Монреал, изд. H.R.W.
- Морони М.Дж., 1970. Comprendre la statistique, Verviers, Gerard et Cie.
- Сийгъл С., 1956. Непараметрична статистика, Ню Йорк, MacGraw-Hill Book Co.
Приложение за електронни таблици
Бележки. 1) За големи извадки или нива на значимост под 0,05 вижте таблиците в статистическите учебници.
2) Таблици със стойности за други непараметрични критерии могат да бъдат намерени в специални насоки (вижте библиографията).
Таблица 1. Стойности на критериите TСтудент | |
ч | 0,05 |
1 | 6,31 |
2 | 2,92 |
3 | 2,35 |
4 | 2,13 |
5 | 2,02 |
6 | 1,94 |
7 | 1,90 |
8 | 1,86 |
9 | 1,83 |
10 | 1,81 |
11 | 1,80 |
12 | 1,78 |
13 | 1,77 |
14 | 1,76 |
15 | 1,75 |
16 | 1,75 |
17 | 1,74 |
18 | 1,73 |
19 | 1,73 |
20 | 1,73 |
21 | 1,72 |
22 | 1,72 |
23 | 1,71 |
24 | 1,71 |
25 | 1,71 |
26 | 1,71 |
27 | 1,70 |
28 | 1,70 |
29 | 1,70 |
30 | 1,70 |
40 | 1,68 |
¥ | 1,65 |
Таблица 2. Стойности на критерия χ 2 | |
ч | 0,05 |
1 | 3,84 |
2 | 5,99 |
3 | 7,81 |
4 | 9,49 |
5 | 11,1 |
6 | 12,6 |
7 | 14,1 |
8 | 15,5 |
9 | 16,9 |
10 | 18,3 |
Таблица 3. Надеждни Z стойности | |
Р | З |
0,05 | 1,64 |
0,01 | 2,33 |
Таблица 4. Надеждни (критични) стойности на r | ||
h = (N-2) | p= 0,05 (5%) | |
3 | 0,88 | |
4 | 0,81 | |
5 | 0,75 | |
6 | 0,71 | |
7 | 0,67 | |
8 | 0,63 | |
9 | 0,60 | |
10 | 0,58 | |
11 | 0.55 | |
12 | 0,53 | |
13 | 0,51 | |
14 | 0,50 | |
15 | 0,48 | |
16 | 0,47 | |
17 | 0,46 | |
18 | 0,44 | |
19 | 0,43 | |
20 | 0,42 |
Таблица 5. Надеждни (критични) стойности на r s | |
h = (N-2) | p = 0,05 |
2 | 1,000 |
3 | 0,900 |
4 | 0,829 |
5 | 0,714 |
6 | 0,643 |
7 | 0,600 |
8 | 0,564 |
10 | 0,506 |
12 | 0,456 |
14 | 0,425 |
16 | 0,399 |
18 | 0,377 |
20 | 0,359 |
22 | 0,343 |
24 | 0,329 |
26 | 0,317 |
28 | 0,306 |
Коефициент на корелацияе стойност, която може да варира от +1 до -1. В случай на пълна положителна корелация този коефициент е равен на плюс 1 (те казват, че с увеличаване на стойността на една променлива се увеличава стойността на друга променлива), а с пълна отрицателна корелация - минус 1 (посочете обратна връзка , т.е. когато стойностите на една променлива се увеличават, стойностите на другата намаляват).
Пример 1:
Графика на зависимостта на срамежливост и депресия. Както можете да видите, точките (субектите) не са разположени произволно, а се подреждат около една линия и, гледайки тази линия, можем да кажем, че колкото по-висока е срамежливостта в човек, толкова по-депресивни, т.е. тези явления са взаимно свързани.
Пример 2: Графика за срамежливост и общителност. Виждаме, че с нарастването на срамежливостта общителността намалява. Техният коефициент на корелация е -0,43. По този начин коефициент на корелация, по-голям от 0 до 1, показва правопропорционална връзка (колкото повече ... толкова повече ...), а коефициент от -1 до 0 показва обратно пропорционална връзка (колкото повече ... толкова по-малко . ..)
Ако коефициентът на корелация е 0, двете променливи са напълно независими една от друга.
корелация- това е връзка, при която влиянието на отделните фактори се проявява само като тенденция (осреднено) с масово наблюдение на действителни данни. Примери за корелационна зависимост могат да бъдат зависимостта между размера на активите на банката и размера на печалбата на банката, растежа на производителността на труда и трудовия стаж на служителите.
Използват се две системи за класификация на корелациите според тяхната сила: обща и частна.
Общата класификация на корелациите: 1) силна или близка с коефициент на корелация r> 0,70; 2) средна при 0,500,70, а не само корелация с високо ниво на значимост.Следващата таблица изброява имената на коефициентите на корелация за различните видове скали.
Дихотомична скала (1/0) | Рангова (порядкова) скала | ||
Дихотомична скала (1/0) | Коефициент на асоцииране на Пиърсън, коефициент на четириклетъчна конюгация на Пиърсън. | Бисерична корелация | |
Рангова (порядкова) скала | Ранг-бисериална корелация. | Коефициент на рангова корелация на Spearman или Kendall. | |
Интервална и абсолютна скала | Бисерична корелация | Стойностите на интервалната скала се преобразуват в рангове и се използва коефициентът на ранг | Коефициент на корелация на Пиърсън (коефициент на линейна корелация) |
При r=0 няма линейна корелация. В този случай груповите средни на променливите съвпадат с техните общи средни, а регресионните линии са успоредни на координатните оси.
Равенство r=0 говори само за липсата на линейна корелационна зависимост (некорелирани променливи), но не като цяло за липсата на корелация и още повече за статистическа зависимост.
Понякога заключението, че няма корелация, е по-важно от наличието на силна корелация. Нулева корелация на две променливи може да показва, че няма влияние на едната променлива върху другата, при условие че се доверим на резултатите от измерванията.
В SPSS: 11.3.2 Коефициенти на корелация
Досега сме установили само самия факт на съществуването на статистическа връзка между два признака. След това ще се опитаме да разберем какви изводи могат да се направят за силата или слабостта на тази зависимост, както и за нейната форма и посока. Критериите за количествено определяне на връзката между променливите се наричат корелационни коефициенти или мерки за свързаност. Две променливи са положително корелирани, ако има пряка, еднопосочна връзка между тях. В еднопосочна връзка малките стойности на една променлива съответстват на малки стойности на другата променлива, големите стойности съответстват на големи. Две променливи са отрицателно корелирани, ако има обратна връзка между тях. При многопосочна връзка малките стойности на една променлива съответстват на големи стойности на другата променлива и обратно. Стойностите на коефициентите на корелация винаги са в диапазона от -1 до +1.
Коефициентът на Спирман се използва като коефициент на корелация между променливи, принадлежащи към ординалната скала, а коефициентът на корелация на Пиърсън (момент на продуктите) се използва за променливи, принадлежащи към интервалната скала. В този случай трябва да се отбележи, че всяка дихотомична променлива, тоест променлива, принадлежаща към номиналната скала и имаща две категории, може да се счита за ординална.
Първо ще проверим дали има връзка между променливите за пола и психиката от файла studium.sav. При това вземаме предвид, че дихотомичната променлива пол може да се счита за ординална променлива. Направете следното:
Изберете от командното меню Analyze (Analysis) Descriptive Statistics (Описателна статистика) Crosstabs... (Contingency tables)
· Преместете променливата пол в списък от редове и променливата психика в списък с колони.
· Щракнете върху бутона Статистика.... В диалоговия прозорец Crosstabs: Statistics поставете отметка в полето Correlations. Потвърдете избора си с бутона Продължи.
· В диалоговия прозорец Crosstabs спрете показването на таблици, като поставите отметка в полето Supress tables. Щракнете върху бутона OK.
Коефициентите на корелация на Spearman и Pearson ще бъдат изчислени и тяхната значимост ще бъде тествана:
/ SPSS 10
Задача номер 10 Корелационен анализ
Концепцията за корелация
Корелацията или коефициентът на корелация е статистически показател вероятностенвръзки между две променливи, измерени в количествени скали. За разлика от функционалната връзка, при която всяка стойност на една променлива съответства на строго определенистойността на друга променлива, вероятностна връзкахарактеризиращ се с това, че всяка стойност на една променлива съответства на набор от стойностиДруга променлива, пример за вероятностна връзка е връзката между височината и теглото на хората. Ясно е, че хората с различно тегло могат да имат еднакъв ръст и обратното.
Корелацията е стойност между -1 и + 1 и се обозначава с буквата r. Освен това, ако стойността е по-близо до 1, това означава наличие на силна връзка, а ако е по-близо до 0, тогава слаба. Стойност на корелация по-малка от 0,2 се счита за слаба корелация, повече от 0,5 - висока. Ако коефициентът на корелация е отрицателен, това означава, че има обратна връзка: колкото по-висока е стойността на една променлива, толкова по-ниска е стойността на другата.
В зависимост от приетите стойности на коефициента r могат да се разграничат различни видове корелация:
Силна положителна корелациясе определя от стойността r=1. Терминът "строг" означава, че стойността на една променлива се определя еднозначно от стойностите на друга променлива, а терминът " положителен" -че с нарастването на стойността на една променлива стойността на другата променлива също се увеличава.
Строгата корелация е математическа абстракция и почти никога не се среща в реални изследвания.
положителна корелациясъответства на стойностите 0
Липса на корелациясе определя от стойността r=0. Нулев коефициент на корелация показва, че стойностите на променливите не са свързани една с друга по никакъв начин.
Липса на корелация з о : 0 r xy =0 формулиран като размисъл нулахипотези в корелационния анализ.
отрицателна корелация: -1
Силна отрицателна корелацияопределя се от стойността r= -1. Тя, подобно на строга положителна корелация, е абстракция и не намира израз в практическите изследвания.
маса 1
Видове корелация и техните определения
Методът за изчисляване на коефициента на корелация зависи от вида на скалата, на която се измерват стойностите на променливата.
Коефициент на корелация rПиърсъне основният и може да се използва за променливи с номинални и частично подредени интервални скали, разпределението на стойностите, върху които съответства на нормалното (корелация на продуктовите моменти). Корелационният коефициент на Pearson дава доста точни резултати и в случаите на необичайни разпределения.
За разпределения, които не са нормални, е за предпочитане да се използват корелационните коефициенти на Spearman и Kendall. Те се класират, защото програмата предварително класира корелираните променливи.
Програмата SPSS изчислява корелацията r-Spearman по следния начин: първо променливите се преобразуват в рангове и след това формулата на Pearson се прилага към ранговете.
Корелацията, предложена от М. Кендъл, се основава на идеята, че посоката на връзката може да се прецени чрез сравняване на субектите по двойки. Ако за двойка субекти промяната в X съвпада по посока с промяната в Y съвпада, тогава това показва положителна връзка. Ако не съвпада, тогава за отрицателна връзка. Този коефициент се използва предимно от психолози, работещи с малки извадки. Тъй като социолозите работят с големи масиви от данни, е трудно да се сортират двойки, да се идентифицира разликата в относителните честоти и инверсии на всички двойки субекти в извадката. Най-често срещаният е коеф. Пиърсън.
Тъй като корелационният коефициент rPearson е основният и може да се използва (с известна грешка в зависимост от вида на скалата и нивото на отклонение в разпределението) за всички променливи, измерени на количествени скали, ще разгледаме примери за използването му и ще сравним резултати, получени с резултатите от измерванията, използващи други корелационни коефициенти.
Формулата за изчисляване на коеф r- Пиърсън:
r xy = ∑ (Xi-Xav)∙(Yi-Yav) / (N-1)∙σ x ∙σ y ∙
Където: Xi, Yi- Стойности на две променливи;
Xav, Yav - средни стойности на две променливи;
σ x , σ y са стандартни отклонения,
N е броят на наблюденията.
Двойни корелации
Например, бихме искали да разберем как отговорите между различните видове традиционни ценности корелират в представите на учениците за идеалното място на работа (променливи: a9.1, a9.3, a9.5, a9.7) , а след това за съотношението на либералните стойности (a9 .2, a9.4, a9.6, a9.8). Тези променливи се измерват на 5-членни подредени скали.
Използваме процедурата: „Анализ“, „Корелации“, „Сдвоени“. По подразбиране коеф Pearson се задава в диалоговия прозорец. Използваме коефициента Пиърсън
Тестваните променливи се прехвърлят в прозореца за избор: a9.1, a9.3, a9.5, a9.7
С натискане на OK получаваме изчислението:
Корелации
a9.1.t. Колко важно е да имате достатъчно време за семейството и личния живот? |
Корелация на Пиърсън |
||||
Стойност (двустранно) |
|||||
a9.3.t. Колко важно е да не се страхувате да не загубите работата си? |
Корелация на Пиърсън |
||||
Стойност (двустранно) |
|||||
a9.5.t. Колко важно е да имате такъв шеф, който да се консултира с вас, когато вземате това или онова решение? |
Корелация на Пиърсън |
||||
Стойност (двустранно) |
|||||
a9.7.t. Колко важно е да работиш в сплотен екип, да се чувстваш част от него? |
Корелация на Пиърсън |
||||
Стойност (двустранно) |
|||||
** Корелацията е значима на ниво 0,01 (двустранно).
Таблица на количествените стойности на изградената корелационна матрица
Частични корелации:
Първо, нека изградим двойна корелация между тези две променливи:
Корелации |
|||
c8. Чувствайте се близо до тези, които живеят близо до вас, съседите |
Корелация на Пиърсън |
||
Стойност (двустранно) |
|||
c12. Чувствайте се близо до семейството им |
Корелация на Пиърсън |
||
Стойност (двустранно) |
|||
**. Корелацията е значима на ниво 0,01 (двустранно). |
След това използваме процедурата за построяване на частична корелация: „Анализ“, „Корелации“, „Частична“.
Да предположим, че стойността „Важно е самостоятелно да определите и промените реда на вашата работа“ по отношение на посочените променливи ще бъде решаващият фактор, под влиянието на който идентифицираната по-рано връзка ще изчезне или ще се окаже малко значима .
Корелации |
||||
Изключени променливи |
c8. Чувствайте се близо до тези, които живеят близо до вас, съседите |
c12. Чувствайте се близо до семейството им |
||
c16. Чувствайте се близо до хора, които имат същото богатство като вас |
c8. Чувствайте се близо до тези, които живеят близо до вас, съседите |
Корелация |
||
Значение (двустранно) |
||||
c12. Чувствайте се близо до семейството им |
Корелация |
|||
Значение (двустранно) |
||||
Както се вижда от таблицата, под влиянието на контролната променлива връзката леко намалява: от 0,120 до 0,102. тя остава достатъчно висока и позволява да се опровергае нулевата хипотеза с нулева грешка.
Коефициент на корелация
Най-точният начин за определяне на плътността и характера на корелацията е да се намери коефициентът на корелация. Коефициентът на корелация е число, определено по формулата:
където r xy е корелационният коефициент;
x i -стойности на първата характеристика;
i - стойности на втората характеристика;
Средно аритметично на стойностите на първата характеристика
Средно аритметично на стойностите на втората характеристика
За да използваме формула (32), изграждаме таблица, която ще осигури необходимата последователност при подготовката на числата за намиране на числителя и знаменателя на коефициента на корелация.
Както се вижда от формула (32), последователността от действия е следната: намираме средните аритметични стойности на двата знака x и y, намираме разликата между стойностите на знака и неговата средна стойност (х i - ) и y i - ), тогава намираме техния продукт (х i - ) ( y i - ) – сумата на последното дава числителя на корелационния коефициент. За да се намери знаменателят му, трябва да се повдигнат на квадрат разликите (x i -) и (y i -), да се намерят сумите им и да се извлече корен квадратен от техния продукт.
Така например 31, намирането на коефициента на корелация в съответствие с формула (32) може да бъде представено по следния начин (Таблица 50).
Полученото число на коефициента на корелация позволява да се установи наличието, близостта и характера на връзката.
1. Ако коефициентът на корелация е нула, няма връзка между характеристиките.
2. Ако коефициентът на корелация е равен на единица, връзката между признаците е толкова голяма, че се превръща във функционална.
3. Абсолютната стойност на коефициента на корелация не надхвърля интервала от нула до единица:
Това дава възможност да се съсредоточи върху плътността на връзката: колкото по-близо до нула е коефициентът, толкова по-слаба е връзката и колкото по-близо до единица, толкова по-близо е връзката.
4. Знакът на корелационния коефициент "плюс" означава пряка корелация, знакът "минус" означава обратното.
Таблица 50
x i | аз | (х i - ) | (y i - ) | (x i - )(y i - ) | (х i - )2 | (y i - )2 |
14,00 | 12,10 | -1,70 | -2,30 | +3,91 | 2,89 | 5,29 |
14,20 | 13,80 | -1,50 | -0,60 | +0,90 | 2,25 | 0,36 |
14,90 | 14,20 | -0,80 | -0,20 | +0,16 | 0,64 | 0,04 |
15,40 | 13,00 | -0,30 | -1,40 | +0,42 | 0,09 | 1,96 |
16,00 | 14,60 | +0,30 | +0,20 | +0,06 | 0,09 | 0,04 |
17,20 | 15,90 | +1,50 | +2,25 | 2,25 | ||
18,10 | 17,40 | +2,40 | +2,00 | +4,80 | 5,76 | 4,00 |
109,80 | 101,00 | 12,50 | 13,97 | 13,94 |
Така корелационният коефициент, изчислен в Пример 31, е r xy = +0,9. ни позволява да направим следните изводи: има корелация между големината на мускулната сила на дясната и лявата ръка при изследваните ученици (коефициентът r xy \u003d + 0,9 е различен от нула), връзката е много тясна (коефициентът r xy \u003d + 0,9 е близо до единица), корелацията е пряка (коефициентът r xy = +0,9 е положителен), т.е. с увеличаване на мускулната сила на едната ръка силата на другата ръка се увеличава.
При изчисляване на коефициента на корелация и използване на неговите свойства трябва да се има предвид, че заключенията дават правилни резултати, когато признаците са нормално разпределени и когато се разглежда връзката между голям брой стойности на двата признака.
В разглеждания пример 31 бяха анализирани само 7 стойности на двете характеристики, което, разбира се, не е достатъчно за такива изследвания. Тук отново напомняме, че примерите в тази книга като цяло и в тази глава в частност имат естество за илюстриране на методи, а не подробно представяне на някакви научни експерименти. В резултат на това се вземат предвид малък брой стойности на характеристиките, измерванията са закръглени - всичко това се прави, за да не се замъглява идеята за метода с тромави изчисления.
Особено внимание трябва да се обърне на същността на разглежданата връзка. Коефициентът на корелация не може да доведе до правилните резултати от изследването, ако анализът на връзката между характеристиките се извършва формално. Да се върнем към пример 31. И двата разглеждани знака бяха стойностите на мускулната сила на дясната и лявата ръка. Нека си представим, че под признак x i в пример 31 (14.0; 14.2; 14.9... ...18.1) имаме предвид дължината на произволно уловената риба в сантиметри, а под признак y i (12.1 ; 13.8; 14.2 ... ... 17.4) - теглото на инструментите в лабораторията в килограми. Формално, използвайки апарата за изчисления за намиране на коефициента на корелация и в този случай също получавайки r xy =+0>9, трябваше да заключим, че има тясна връзка от пряк характер между дължината на рибата и теглото на инструментите. Абсурдността на подобно заключение е очевидна.
За да се избегне формален подход към използването на коефициента на корелация, трябва да се използва всеки друг метод - математически, логически, експериментален, теоретичен - за идентифициране на възможността за корелация между знаци, тоест за откриване на органичното единство на знаците. Едва тогава човек може да започне да използва корелационен анализ и да установи величината и характера на връзката.
В математическата статистика съществува и понятието множествена корелация- Връзки между три или повече характеристики. В тези случаи се използва коефициент на множествена корелация, състоящ се от коефициентите на двойна корелация, описани по-горе.
Например коефициентът на корелация на три знака - x і , y і , z і - е:
където R xyz - коефициент на множествена корелация, изразяващ как характеристиката x i зависи от характеристиките y i и z i ;
r xy -коефициент на корелация между признаците x i и y i ;
r xz - коефициент на корелация между признаците Xi и Zi;
r yz - коефициент на корелация между признаците y i , z i
Корелационният анализ е:
Корелационен анализКорелация- статистическа връзка на две или повече случайни променливи (или променливи, които могат да се считат за такива с някаква приемлива степен на точност). В същото време промените в една или повече от тези величини водят до систематична промяна в другата или други величини. Коефициентът на корелация служи като математическа мярка за корелацията на две случайни променливи.
Корелацията може да бъде положителна и отрицателна (възможно е и да няма статистическа връзка – например за независими случайни променливи). отрицателна корелация - корелация, при която увеличението на една променлива е свързано с намаляване на друга променлива, докато коефициентът на корелация е отрицателен. положителна корелация - корелация, при която увеличението на една променлива е свързано с увеличение на друга променлива, докато коефициентът на корелация е положителен.
автокорелация - статистическа зависимост между случайни величини от една и съща серия, но взети с изместване, например за случаен процес - с изместване във времето.
Методът за обработка на статистически данни, който се състои в изследване на коефициентите (корелациите) между променливите, се нарича корелационен анализ.
Коефициент на корелация
Коефициент на корелацияили коефициент на корелация на двойкив теорията на вероятностите и статистиката това е индикатор за естеството на промяната в две случайни променливи. Коефициентът на корелация се обозначава с латинската буква R и може да приема стойности между -1 и +1. Ако модулната стойност е по-близо до 1, това означава наличие на силна връзка (с коефициент на корелация, равен на единица, те говорят за функционална връзка), а ако е по-близо до 0, тогава слаба.
Коефициент на корелация на Пиърсън
За метричните величини се използва корелационният коефициент на Пиърсън, чиято точна формула е въведена от Франсис Галтън:
Позволявам х,Y- две случайни променливи, дефинирани в едно и също вероятностно пространство. Тогава техният коефициент на корелация се дава по формулата:
,където cov е ковариацията и D е дисперсията, или еквивалентно,
,където символът означава математическото очакване.
За да представите графично такава връзка, можете да използвате правоъгълна координатна система с оси, които съответстват на двете променливи. Всяка двойка стойности е маркирана със специфичен символ. Такъв график се нарича "диапазон на разсейване".
Методът за изчисляване на коефициента на корелация зависи от вида на скалата, към която се отнасят променливите. И така, за измерване на променливи с интервални и количествени скали е необходимо да се използва коефициентът на корелация на Pearson (корелация на продуктовите моменти). Ако поне една от двете променливи има порядъчна скала или не е нормално разпределена, трябва да се използва ранговата корелация на Spearman или τ (tau) на Kendal. В случай, че една от двете променливи е дихотомна, се използва точкова двусерийна корелация, а ако и двете променливи са дихотомна, се използва четириполева корелация. Изчисляването на коефициента на корелация между две недихотомни променливи има смисъл само ако връзката между тях е линейна (еднопосочна).
Коефициент на корелация на Kendell
Използва се за измерване на взаимно разстройство.
Коефициент на корелация на Спирман
Свойства на коефициента на корелация
- Неравенство на Коши - Буняковски:
Корелационен анализ
Корелационен анализ- метод за обработка на статистически данни, който се състои в изучаване на коефициентите ( корелации) между променливи. В този случай коефициентите на корелация между една двойка или множество двойки характеристики се сравняват, за да се установят статистически връзки между тях.
Цел корелационен анализ- предоставяне на информация за една променлива с помощта на друга променлива. В случаите, когато е възможно да се постигне целта, казваме, че променливите корелират. В най-общата си форма приемането на хипотезата за наличието на корелация означава, че промяна в стойността на променлива А ще настъпи едновременно с пропорционална промяна в стойността на В: ако и двете променливи се увеличат, тогава корелацията е положителнаако една променлива нараства, а другата намалява, корелацията е отрицателна.
Корелацията отразява само линейната зависимост на величините, но не отразява функционалната им свързаност. Например, ако изчислим коефициента на корелация между стойностите А = сазн(х) и б = ° Сос(х), тогава тя ще бъде близка до нула, т.е. няма зависимост между количествата. Междувременно количествата A и B очевидно са свързани функционално според закона сазн 2(х) + ° Сос 2(х) = 1.
Ограничения на корелационния анализ
Графики на разпределения на двойки (x,y) със съответните корелационни коефициенти x и y за всяка от тях. Имайте предвид, че коефициентът на корелация отразява линейна връзка (горен ред), но не описва крива на връзката (среден ред) и изобщо не е подходящ за описване на сложни, нелинейни зависимости (долния ред).
- Прилагането е възможно, ако има достатъчен брой случаи за изследване: за определен тип коефициент на корелация той варира от 25 до 100 двойки наблюдения.
- Второто ограничение следва от хипотезата на корелационния анализ, която включва линейна зависимост на променливите. В много случаи, когато е надеждно известно, че зависимостта съществува, корелационният анализ може да не даде резултати просто защото зависимостта е нелинейна (изразена например като парабола).
- Сам по себе си фактът на корелация не дава основание да се твърди коя от променливите предшества или причинява промени или че променливите като цяло са причинно свързани помежду си, например поради действието на трети фактор.
Област на приложение
Този метод за обработка на статистически данни е много популярен в икономиката и социалните науки (по-специално в психологията и социологията), въпреки че обхватът на приложение на коефициентите на корелация е обширен: контрол на качеството на промишлени продукти, металургия, селскостопанска химия, хидробиология, биометрия, и други.
Популярността на метода се дължи на две точки: коефициентите на корелация са относително лесни за изчисляване, прилагането им не изисква специална математическа подготовка. В съчетание с лекотата на интерпретация, лекотата на прилагане на коефициента доведе до широкото му използване в областта на статистическия анализ на данни.
фалшива корелация
Често примамливата простота на изследването на корелация насърчава изследователя да прави фалшиви интуитивни заключения за наличието на причинно-следствена връзка между двойки черти, докато коефициентите на корелация установяват само статистически връзки.
В съвременната количествена методология на социалните науки всъщност е налице изоставяне на опитите за установяване на причинно-следствени връзки между наблюдаваните променливи чрез емпирични методи. Следователно, когато изследователите в социалните науки говорят за установяване на връзки между променливите, които изучават, се подразбира или общо теоретично предположение, или статистическа зависимост.
Вижте също
- Автокорелационна функция
- Крос-корелационна функция
- ковариация
- Коефициент на определяне
- Регресионен анализ
Фондация Уикимедия. 2010 г.
Различни функции могат да бъдат свързани.
Между тях има 2 вида връзка:
- функционални;
- корелация.
Корелацияпреведено на руски - нищо повече от връзка.
В случай на корелация има съответствие на няколко стойности на един атрибут с няколко стойности на друг атрибут. Като примери можем да разгледаме установените корелации между:
- дължината на лапите, шията, клюна при птици като чапли, жерави, щъркели;
- показатели за телесна температура и пулс.
За повечето биомедицински процеси наличието на този тип връзка е статистически доказано.
Статистическите методи позволяват да се установи фактът на наличието на взаимозависимост на характеристиките. Използването на специални изчисления за това води до установяване на коефициенти на корелация (мерки за свързаност).
Такива изчисления се наричат корелационен анализ.Извършва се, за да се потвърди зависимостта на 2 променливи (случайни променливи) една от друга, която се изразява с коефициента на корелация.
Използването на метода на корелация ни позволява да решим няколко проблема:
- идентифициране на връзката между анализираните параметри;
- познаването на наличието на корелация позволява решаването на проблеми с прогнозирането. По този начин съществува реална възможност да се предвиди поведението на даден параметър въз основа на анализа на поведението на друг корелиран параметър;
- класификация, основана на избора на признаци, независими един от друг.
За променливи:
- спрямо ординалната скала се изчислява коефициентът на Спирман;
- свързан с интервалната скала – коефициентът на Пиърсън.
Това са най-често използваните параметри, но има и други.
Стойността на коефициента може да бъде изразена както положително, така и отрицателно.
В първия случай с увеличаване на стойността на една променлива се наблюдава увеличение на втората. При отрицателен коефициент моделът е обратен.
За какво е коефициентът на корелация?
Свързаните помежду си случайни променливи могат да имат напълно различен характер на тази връзка. Не е задължително да е функционален, когато има пряка връзка между количествата. Най-често и двете величини се влияят от цял набор от различни фактори, в случаите, когато те са общи за двете величини, се наблюдава формирането на свързани модели.
Това означава, че статистически доказаният факт за наличието на връзка между количествата не е потвърждение, че е установена причината за наблюдаваните промени. Като правило изследователят заключава, че има две взаимосвързани последици.
Свойства на коефициента на корелация
Тази статистика има следните свойства:
- стойността на коефициента варира от -1 до +1. Колкото по-близо до екстремните стойности, толкова по-силна е положителната или отрицателната връзка между линейните параметри. В случай на нулева стойност говорим за липса на корелация между характеристиките;
- положителна стойност на коефициента показва, че в случай на увеличаване на стойността на един признак се наблюдава увеличение на втория (положителна корелация);
- отрицателна стойност - при повишаване на стойността на един признак се наблюдава намаляване на втория (отрицателна корелация);
- приближаването на стойността на индикатора до крайните точки (или -1, или +1) показва наличието на много силна линейна връзка;
- показателите на чертите могат да се променят при постоянна стойност на коефициента;
- коефициентът на корелация е безразмерна величина;
- наличието на корелация не е задължително потвърждение за причинно-следствена връзка.
Стойности на коефициента на корелация
Силата на корелацията може да се характеризира чрез прибягване до скалата на Челдок, в която качествена характеристика съответства на определена числена стойност.
В случай на положителна корелация при стойност:
- 0-0,3 - корелацията е много слаба;
- 0,3-0,5 - слаб;
- 0,5-0,7 - средна якост;
- 0,7-0,9 - високо;
- 0.9-1 - много висока сила на корелация.
Скалата може да се използва и за отрицателна корелация. В този случай качествените характеристики се заменят с противоположни.
Можете да използвате опростената скала на Cheldok, в която се разграничават само 3 степени на силата на корелацията:
- много силен - показатели ± 0,7 - ± 1;
- средно - показатели ± 0,3 - ± 0,699;
- много слаб - показатели 0 - ± 0,299.
Този статистически показател позволява не само да се тества предположението за съществуването на линейна връзка между характеристиките, но и да се установи нейната сила.
Видове коефициент на корелация
Коефициентите на корелация могат да бъдат класифицирани по знак и стойност:
- положителен;
- нула;
- отрицателен.
В зависимост от анализираните стойности се изчислява коефициентът:
- Pearson;
- Копиеносец;
- Кендала;
- знаци на Фехнер;
- съгласуване или множествена рангова корелация.
Корелационният коефициент на Pearson се използва за установяване на директни връзки между абсолютните стойности на променливите. В този случай разпределението на двете серии от променливи трябва да се доближава до нормалното. Променливите, които се сравняват, трябва да се различават по същия брой различни характеристики. Скалата, представяща променливите, трябва да бъде или интервална скала, или скала на отношение.
- точно установяване на силата на корелация;
- сравнение на количествени характеристики.
Има няколко недостатъка от използването на линейния корелационен коефициент на Pearson:
- методът е нестабилен в случай на отклонения от числови стойности;
- с помощта на този метод е възможно да се определи силата на корелация само за линейна връзка; за други видове взаимни връзки на променливи трябва да се използват методи за регресионен анализ.
Ранговата корелация се определя по метода на Спирман, който дава възможност за статистическо изследване на връзката между явленията. Благодарение на този коефициент се изчислява действителната степен на паралелност на двете количествено изразени серии от признаци, както и се оценява близостта на установената връзка.
- не изисква точна дефиниция на стойността на силата на корелация;
- сравняваните показатели имат както количествени, така и атрибутивни стойности;
- сравнение на редове от характеристики с отворени варианти на стойности.
Методът на Spearman се отнася до методите за непараметричен анализ, така че не е необходимо да се проверява нормалността на разпределението на характеристиките. Освен това ви позволява да сравнявате показатели, изразени в различни скали. Например сравняване на стойностите на броя на червените кръвни клетки в определен обем кръв (непрекъсната скала) и експертна оценка, изразена в точки (порядъчна скала).
Ефективността на метода се влияе отрицателно от голяма разлика между стойностите на сравняваните стойности. Методът е неефективен и в случаите, когато измерената стойност се характеризира с неравномерно разпределение на стойностите.
Стъпка по стъпка изчисляване на коефициента на корелация в Excel
Изчисляването на коефициента на корелация включва последователно изпълнение на редица математически операции.
Горната формула за изчисляване на коефициента на Пиърсън показва колко трудоемък е този процес, ако се извършва ръчно.
Използването на възможностите на Excel ускорява процеса на намиране на коефициента в пъти.
Достатъчно е да следвате прост алгоритъм от действия:
- въвеждане на основна информация - колона от x стойности и колона от y стойности;
- в инструментите се избира и отваря раздела Формули;
- в раздела, който се отваря, изберете „Вмъкване на fx функция“;
- в диалоговия прозорец, който се отваря, се избира статистическата функция "Correl", която ви позволява да изчислите коефициента на корелация между 2 масива от данни;
- данните се въвеждат в прозореца, който се отваря: масив 1 - диапазонът от стойности на колоната x (данните трябва да бъдат избрани), масив 2 - диапазонът от стойности на колоната y;
- натиска се клавишът „OK“, резултатът от изчисляването на коефициента се появява в реда „стойност“;
- заключение относно наличието на корелация между 2 набора от данни и нейната сила.
Корелационният модел (CM) е изчислителна програма, която предоставя математическо уравнение, в което полученият индикатор се определя количествено в зависимост от един или повече показатели.
yx \u003d ao + a1x1
където: y - показател за ефективност, в зависимост от фактора x;
x - факторен знак;
a1 - параметър KM, показващ колко ще се промени ефективният показател y, когато факторът x се промени с единица, ако в същото време всички други фактори, влияещи върху y, останат непроменени;
ao - параметър KM, който показва влиянието на всички други фактори върху ефективния показател y, с изключение на знака на фактора x
При избора на ефективните и факторните показатели на модела е необходимо да се вземе предвид фактът, че ефективният показател във веригата от причинно-следствени връзки е на по-високо ниво от факторните показатели.
Характеристики на корелационния модел
След изчисляване на параметрите на корелационния модел се изчислява коефициентът на корелация.
p - двойният коефициент на корелация, -1 ≤ p ≤ 1, показва силата и посоката на влиянието на факторния показател върху ефективния. Колкото по-близо до 1, толкова по-силна е връзката, колкото по-близо до 0, толкова по-слаба е връзката. Ако коефициентът на корелация е положителен, тогава връзката е пряка, ако е отрицателна, тя е обратна.
Формула за коефициент на корелация: pxy \u003d (xy-x * 1 / y) / eh * ey
ex=xx2-(x)2; eu=y2-(y)2
Ако CM е линеен многофакторен, имащ формата:
yx \u003d ao + a1x1 + a2x2 + ... + axp
тогава за него се изчислява коефициент на множествена корелация.
0 ≤ Р ≤ 1 и показва силата на влиянието на всички факторни показатели взети заедно върху ефективния.
P \u003d 1- ((ъъъ-уй) 2 / (yi - usr) 2)
Където: uh - ефективен показател - изчислена стойност;
ui - действителна стойност;
usr - действителна стойност, средна.
Изчислената стойност yx се получава в резултат на заместване в корелационния модел вместо x1, x2 и т.н. действителните им стойности.
За еднофакторни и многофакторни нелинейни модели коефициентът на корелация се изчислява:
1 ≤ m ≤ 1;
Смята се, че връзката между ефективните и факторните показатели, включени в модела, е слаба, ако стойността на коефициента на плътност на връзката (m) е в рамките на 0-0,3; ако 0,3-0,7 - плътността на връзката е средна; над 0,7-1 - връзката е силна.
Тъй като коефициентът на корелация (сдвоен) p, коефициентът на корелация (множество) P, съотношението на корелация m са вероятностни стойности, тогава техните коефициенти на значимост се изчисляват за тях (определени от таблиците). Ако тези коефициенти са по-големи от табличната им стойност, тогава коефициентите на близост на връзката са значими причини. Ако коефициентите на значимост на плътността на връзката са по-малки от табличните стойности или ако самият коефициент на връзка е по-малък от 0,7, тогава не всички факторни показатели, които значително влияят на резултата, са включени в модела.
Коефициентът на детерминация ясно демонстрира процента на факторните показатели, включени в модела, които определят формирането на резултата.
Ако коефициентът на детерминация е по-голям от 50, тогава моделът описва адекватно изследвания процес, ако е по-малък от 50, тогава е необходимо да се върнете към първия етап на изграждане и да преразгледате избора на факторни индикатори за включване в модел.
Коефициентът на Фишер или критерият на Фишер характеризира ефективността на модела като цяло. Ако изчислената стойност на коефициента надвишава стойността на таблицата, тогава конструираният модел е подходящ за анализ, както и индикатори за планиране, изчисления за бъдещето. Приблизителна таблична стойност \u003d 1,5. Ако изчислената стойност е по-малка от стойността в таблицата, е необходимо първо да се изгради моделът, като се включат факторите, които значително влияят на резултата. В допълнение към ефективността на модела като цяло, всеки регресионен коефициент влияе върху съществеността. Ако изчислената стойност на този коефициент надвишава табличната стойност, тогава коефициентът на регресия ще бъде значителен, ако е по-малък, тогава факторният индикатор, за който е изчислен този коефициент, се премахва от извадката, изчисленията започват отначало, но без този фактор .
Коефициентът на корелация е степента на връзка между две променливи. Неговото изчисление дава представа за това дали има връзка между два набора от данни. За разлика от регресията, корелацията не позволява прогнозиране на стойности. Изчисляването на коефициента обаче е важна стъпка в предварителния статистически анализ. Например установихме, че коефициентът на корелация между нивото на преките чуждестранни инвестиции и растежа на БВП е висок. Това ни дава представа, че за да се осигури просперитет, е необходимо да се създаде благоприятен климат именно за чуждестранните предприемачи. Не толкова очевидно заключение на пръв поглед!
Корелация и причинно-следствена връзка
Може би няма нито една област на статистиката, която да е толкова твърдо установена в живота ни. Коефициентът на корелация се използва във всички области на общественото знание. Основната му опасност се крие във факта, че често с високите му стойности се спекулира, за да се убедят хората и да ги накарат да повярват в някакви заключения. В действителност обаче силната корелация изобщо не показва причинно-следствена връзка между количествата.
Коефициент на корелация: формула на Пиърсън и Спирман
Има няколко основни показателя, които характеризират връзката между две променливи. Исторически първият е линейният корелационен коефициент на Пиърсън. В училище се предава. Разработен е от К. Пиърсън и Дж. Юл въз основа на работата на Фр. Галтън. Този коефициент ви позволява да видите връзката между рационални числа, които се променят рационално. Винаги е по-голямо от -1 и по-малко от 1. Отрицателно число показва обратно пропорционална връзка. Ако коефициентът е нула, тогава няма връзка между променливите. Равно на положително число – между изследваните величини съществува правопропорционална зависимост. Коефициентът на рангова корелация на Spearman дава възможност за опростяване на изчисленията чрез изграждане на йерархия от променливи стойности.
Връзки между променливи
Корелацията помага да се отговори на два въпроса. Първо, дали връзката между променливите е положителна или отрицателна. Второ, колко силна е зависимостта. Корелационният анализ е мощен инструмент за получаване на тази важна информация. Лесно е да се види, че доходите и разходите на домакинствата растат и спадат пропорционално. Такава връзка се счита за положителна. Напротив, когато цената на даден продукт се повиши, търсенето му намалява. Такава връзка се нарича отрицателна. Стойностите на коефициента на корелация са между -1 и 1. Нула означава, че няма връзка между изследваните стойности. Колкото по-близо е индикаторът до екстремните стойности, толкова по-силна е връзката (отрицателна или положителна). Липсата на зависимост се доказва с коефициент от -0,1 до 0,1. Трябва да се разбере, че такава стойност показва само липсата на линейна зависимост.
Характеристики на приложението
Използването на двата индикатора зависи от определени допускания. Първо, наличието на силна връзка не определя факта, че едната ценност определя другата. Възможно е да има трето количество, което определя всяко от тях. Второ, високият коефициент на корелация на Pearson не показва причинно-следствена връзка между изследваните променливи. Трето, показва изключително линейна връзка. Корелацията може да се използва за оценка на значими количествени данни (напр. барометрично налягане, температура на въздуха), а не категории като пол или любим цвят.
Множествен коефициент на корелация
Pearson и Spearman изследват връзката между две променливи. Но какво да направите, ако има три или дори повече от тях. Тук идва коефициентът на множествена корелация. Например брутният национален продукт се влияе не само от преките чуждестранни инвестиции, но и от паричната и фискалната политика на държавата, както и от нивото на износа. Темпът на растеж и обемът на БВП са резултат от взаимодействието на редица фактори. Въпреки това трябва да се разбере, че моделът на множествена корелация се основава на редица опростявания и допускания. Първо, мултиколинеарността между количествата е изключена. Второ, връзката между зависимата променлива и променливите, които я влияят, се приема за линейна.
Области на приложение на корелационния и регресионния анализ
Този метод за намиране на връзката между количествата се използва широко в статистиката. Най-често се прибягва в три основни случая:
- За тестване на причинно-следствени връзки между стойностите на две променливи. В резултат на това изследователят се надява да намери линейна зависимост и да изведе формула, която описва тези връзки между количествата. Техните мерни единици могат да бъдат различни.
- За да проверите за връзка между стойностите. В този случай никой не определя коя променлива е зависима. Може да се окаже, че стойността на двете величини определя някакъв друг фактор.
- Да се изведе уравнение. В този случай можете просто да замените числа в него и да разберете стойностите на неизвестната променлива.
Човек в търсене на причинно-следствена връзка
Съзнанието е подредено по такъв начин, че определено трябва да обясним събитията, които се случват наоколо. Човек винаги търси връзка между картината на света, в който живее, и информацията, която получава. Често мозъкът създава ред от хаоса. Той може лесно да види причинно-следствена връзка там, където няма такава. Учените трябва специално да се научат да преодолеят тази тенденция. Способността да се оценяват връзките между данните е обективно съществена в една академична кариера.
Медийни пристрастия
Помислете как наличието на корелация може да бъде изтълкувано погрешно. Група британски студенти с лошо поведение бяха попитани дали родителите им пушат. Тогава тестът беше публикуван във вестника. Резултатът показа силна връзка между пушенето на родителите и престъпността на техните деца. Професорът, който проведе това проучване, дори предложи да се постави предупреждение за това върху цигарените кутии. Има обаче редица проблеми с това заключение. Първо, корелацията не показва коя от величините е независима. Следователно е напълно възможно да се предположи, че пагубният навик на родителите е причинен от непокорството на децата. Второ, невъзможно е да се каже със сигурност, че и двата проблема не са възникнали поради някакъв трети фактор. Например семейства с ниски доходи. Трябва да се отбележи емоционалният аспект на първоначалните заключения на професора, провел проучването. Той беше горещ противник на тютюнопушенето. Затова не е изненадващо, че той тълкува резултатите от изследването си по този начин.
заключения
Погрешното тълкуване на корелацията като причинно-следствена връзка между две променливи може да доведе до неудобни грешки в изследването. Проблемът е, че той лежи в самата сърцевина на човешкото съзнание. Много маркетингови трикове се основават на тази функция. Разбирането на разликата между причинно-следствената връзка и корелацията ви позволява да анализирате рационално информацията както в ежедневието, така и в професионалната си кариера.