Co je to korelace ve statistice. Korelační koeficient je charakteristikou korelačního modelu. Jak interpretovat hodnotu Pearsonova korelačního koeficientu
![Co je to korelace ve statistice. Korelační koeficient je charakteristikou korelačního modelu. Jak interpretovat hodnotu Pearsonova korelačního koeficientu](https://i2.wp.com/psyfactor.org/lib/i/Image45.gif)
" Statistika
Statistika a zpracování dat v psychologii
(pokračování)
Korelační analýza
Při studiu korelace pokuste se zjistit, zda existuje nějaký vztah mezi dvěma ukazateli ve stejném vzorku (například mezi výškou a hmotností dětí nebo mezi úrovní IQ a školním prospěchem) nebo mezi dvěma různými vzorky (například při srovnávání párů dvojčat), a pokud tento vztah existuje, zda je nárůst jednoho ukazatele doprovázen zvýšením (pozitivní korelace) nebo poklesem (negativní korelace) jiný.
Jinými slovy, korelační analýza pomáhá zjistit, zda je možné předvídat možné hodnoty jednoho ukazatele se znalostí hodnoty jiného.
Až dosud jsme při analýze výsledků našich zkušeností se studiem účinků marihuany záměrně ignorovali takový ukazatel, jako je reakční doba. Mezitím by bylo zajímavé ověřit, zda existuje vztah mezi účinností reakcí a jejich rychlostí. To by umožnilo například tvrdit, že čím je člověk pomalejší, tím přesnější a efektivnější bude jeho jednání a naopak.
K tomu lze použít dvě různé metody: parametrickou metodu výpočtu Bravais-Pearsonova koeficientu (r) a výpočet Spearmanova pořadového korelačního koeficientu (r s), který se aplikuje na ordinální data, tzn. je neparametrické. Nejprve si však ujasněme, co je to korelační koeficient.
Korelační koeficient
Korelační koeficient je hodnota, která se může měnit od +1 do -1. V případě úplné kladné korelace je tento koeficient roven plus 1 a v případě úplné záporné korelace je mínus 1. Na grafu to odpovídá přímce procházející průsečíky hodnoty každého datového páru:
Pokud tyto body nejsou zarovnány v přímce, ale tvoří „mrak“, absolutní hodnota korelačního koeficientu bude menší než jedna a při zaokrouhlování mraku se blíží nule:
Pokud je korelační koeficient 0, jsou obě proměnné na sobě zcela nezávislé.
V humanitních oborech je korelace považována za silnou, pokud je její koeficient větší než 0,60; pokud překročí 0,90, pak je korelace považována za velmi silnou. Abychom však mohli vyvozovat závěry o vztazích mezi proměnnými, má velký význam velikost výběrového souboru: čím větší výběr, tím spolehlivější hodnota získaného korelačního koeficientu. Existují tabulky s kritickými hodnotami Bravais-Pearsonových a Spearmanových korelačních koeficientů pro různý počet stupňů volnosti (je roven počtu párů mínus 2, tzn. n- 2). Pouze pokud jsou korelační koeficienty větší než tyto kritické hodnoty, lze je považovat za spolehlivé. Aby byl korelační koeficient 0,70 spolehlivý, mělo by se do analýzy vzít alespoň 8 párů dat ( h =n-2=6) při výpočtu r (viz tabulka 4 v příloze) a 7 párů dat (h = n-2= 5) při výpočtu r s (tabulka 5 v příloze).
Rád bych ještě jednou zdůraznil, že podstata těchto dvou koeficientů je poněkud odlišná. Záporný koeficient r udává, že účinnost je nejčastěji tím vyšší, čím rychlejší je reakční doba, přičemž při výpočtu koeficientu r s bylo nutné ověřit, zda rychlejší subjekty reagují vždy přesněji a pomalejší subjekty méně přesně.
Bravais-Pearsonův korelační koeficient (r) - Jedná se o parametrický ukazatel, pro jehož výpočet se porovnává průměr a směrodatná odchylka výsledků dvou měření. V tomto případě je použit vzorec (u různých autorů může vypadat jinak)
kde Σ XY- součet součinů dat z každého páru;
n je počet párů;
X - průměr pro danou proměnnou X;
Y -
průměr pro proměnná data Y
Sx- směrodatná odchylka pro rozdělení X;
sy- směrodatná odchylka pro rozdělení v
Spearmanův koeficient pořadové korelace ( rs ) - jedná se o neparametrický ukazatel, s jehož pomocí se snaží ve dvou sériích měření odhalit vztah mezi pořadími odpovídajících veličin.
Tento koeficient se snáze vypočítá, ale výsledky jsou méně přesné než při použití r. To je způsobeno skutečností, že při výpočtu Spearmanova koeficientu se používá pořadí dat, nikoli jejich kvantitativní charakteristiky a intervaly mezi třídami.
Faktem je, že při použití korelačního koeficientu Spearmanových hodností (r s) pouze ověřují, zda pořadí dat pro jakýkoli vzorek bude stejné jako v řadě jiných dat pro tento vzorek, párově vztažených k prvnímu (např. , zda budou stejně „řazeni“ studenty psychologie i matematiky, nebo dokonce se dvěma různými učiteli psychologie?). Pokud je koeficient blízký +1, pak to znamená, že se obě řady prakticky shodují, a pokud je tento koeficient blízko -1, můžeme mluvit o úplném inverzním vztahu.
Součinitel rs vypočítané podle vzorce
kde d je rozdíl mezi řadami hodnot konjugovaných vlastností (bez ohledu na její znaménko) a je to počet párů.
Obvykle se tento neparametrický test používá v případech, kdy potřebujete vyvodit nějaké závěry, o kterých se tolik nemluví intervalech mezi údaji, kolik o nich hodnosti, a také když jsou distribuční křivky příliš zkreslené a neumožňují použití parametrických kritérií, jako je koeficient r (v těchto případech může být nutné převést kvantitativní data na ordinální data).
souhrn
Zvažovali jsme tedy různé parametrické a neparametrické statistické metody používané v psychologii. Naše recenze byla velmi povrchní a jejím hlavním úkolem bylo přimět čtenáře, aby pochopil, že statistiky nejsou tak děsivé, jak se zdají, a vyžadují především zdravý rozum. Připomínáme, že údaje o „zkušenosti“, kterými jsme se zde zabývali, jsou fiktivní a nemohou sloužit jako základ pro jakékoli závěry. Takový experiment by však stál za provedení. Protože byla pro tento experiment zvolena čistě klasická technika, mohla být stejná statistická analýza použita v mnoha různých experimentech. V každém případě se nám zdá, že jsme nastínili některé hlavní směry, které mohou být užitečné pro ty, kteří nevědí, kde začít se statistickou analýzou výsledků.
Literatura
- Godefroy J. Co je psychologie. - M., 1992.
- Chatillon G., 1977. Statistique en Sciences humaines, Trois-Rivieres, Ed. SMG.
- Gilbert N. 1978. Statistiques, Montreal, Ed. H.R.W.
- Moroney M.J., 1970. Comprendre la statistique, Verviers, Gerard et Cie.
- Siegel S., 1956. Neparametrická statistika, New York, MacGraw-Hill Book Co.
Tabulková aplikace
Poznámky. 1) Pro velké vzorky nebo hladiny významnosti menší než 0,05 viz tabulky ve statistických učebnicích.
2) Tabulky hodnot pro ostatní neparametrická kritéria lze nalézt ve zvláštních pokynech (viz bibliografie).
Tabulka 1. Hodnoty kritérií t Student | |
h | 0,05 |
1 | 6,31 |
2 | 2,92 |
3 | 2,35 |
4 | 2,13 |
5 | 2,02 |
6 | 1,94 |
7 | 1,90 |
8 | 1,86 |
9 | 1,83 |
10 | 1,81 |
11 | 1,80 |
12 | 1,78 |
13 | 1,77 |
14 | 1,76 |
15 | 1,75 |
16 | 1,75 |
17 | 1,74 |
18 | 1,73 |
19 | 1,73 |
20 | 1,73 |
21 | 1,72 |
22 | 1,72 |
23 | 1,71 |
24 | 1,71 |
25 | 1,71 |
26 | 1,71 |
27 | 1,70 |
28 | 1,70 |
29 | 1,70 |
30 | 1,70 |
40 | 1,68 |
¥ | 1,65 |
Tabulka 2. Hodnoty kritéria χ 2 | |
h | 0,05 |
1 | 3,84 |
2 | 5,99 |
3 | 7,81 |
4 | 9,49 |
5 | 11,1 |
6 | 12,6 |
7 | 14,1 |
8 | 15,5 |
9 | 16,9 |
10 | 18,3 |
Tabulka 3. Spolehlivé hodnoty Z | |
R | Z |
0,05 | 1,64 |
0,01 | 2,33 |
Tabulka 4. Spolehlivé (kritické) hodnoty r | ||
h = (N-2) | p= 0,05 (5%) | |
3 | 0,88 | |
4 | 0,81 | |
5 | 0,75 | |
6 | 0,71 | |
7 | 0,67 | |
8 | 0,63 | |
9 | 0,60 | |
10 | 0,58 | |
11 | 0.55 | |
12 | 0,53 | |
13 | 0,51 | |
14 | 0,50 | |
15 | 0,48 | |
16 | 0,47 | |
17 | 0,46 | |
18 | 0,44 | |
19 | 0,43 | |
20 | 0,42 |
Tabulka 5. Spolehlivé (kritické) hodnoty r s | |
h = (N-2) | p = 0,05 |
2 | 1,000 |
3 | 0,900 |
4 | 0,829 |
5 | 0,714 |
6 | 0,643 |
7 | 0,600 |
8 | 0,564 |
10 | 0,506 |
12 | 0,456 |
14 | 0,425 |
16 | 0,399 |
18 | 0,377 |
20 | 0,359 |
22 | 0,343 |
24 | 0,329 |
26 | 0,317 |
28 | 0,306 |
Korelační koeficient je hodnota, která se může lišit od +1 do -1. V případě úplné kladné korelace je tento koeficient roven plus 1 (říkají, že s nárůstem hodnoty jedné proměnné roste hodnota jiné proměnné) a s úplnou negativní korelací - mínus 1 (uvádějí zpětnou vazbu , tj. když se hodnoty jedné proměnné zvýší, hodnoty druhé se sníží).
Příklad 1:
Graf závislosti plachosti a deprese. Jak vidíte, tečky (předměty) nejsou umístěny náhodně, ale seřazují se kolem jedné čáry a při pohledu na tuto čáru můžeme říci, že čím vyšší je u člověka plachost, tím depresivnější, tj. jsou propojeny.
Př 2: Graf pro plachost a družnost. Vidíme, že jak ostýchavost stoupá, družnost klesá. Jejich korelační koeficient je -0,43. Korelační koeficient větší od 0 do 1 tedy označuje přímo úměrný vztah (čím více ... tím více ...) a koeficient od -1 do 0 ukazuje nepřímo úměrný vztah (čím více ... tím méně . ..)
Pokud je korelační koeficient 0, jsou obě proměnné na sobě zcela nezávislé.
korelace- jedná se o vztah, kdy se vliv jednotlivých faktorů jeví pouze jako trend (v průměru) s hromadným sledováním aktuálních dat. Příkladem korelační závislosti může být závislost mezi velikostí aktiv banky a výší zisku banky, růstem produktivity práce a délkou služby zaměstnanců.
Používají se dva systémy klasifikace korelací podle jejich síly: obecné a partikulární.
Obecná klasifikace korelací: 1) silná nebo těsná s korelačním koeficientem r> 0,70; 2) střední na 0,500,70, a ne pouze korelace s vysokou hladinou významnosti.V následující tabulce jsou uvedeny názvy korelačních koeficientů pro různé typy škál.
Dichotomické měřítko (1/0) | Hodnostní (ordinální) stupnice | ||
Dichotomické měřítko (1/0) | Pearsonův asociační koeficient, Pearsonův čtyřbuněčný konjugační koeficient. | Biseriální korelace | |
Hodnostní (ordinální) stupnice | Pořadová biserální korelace. | Spearmanův nebo Kendallův koeficient pořadové korelace. | |
Intervalová a absolutní stupnice | Biseriální korelace | Hodnoty intervalové stupnice se převedou na pořadí a použije se koeficient pořadí | Pearsonův korelační koeficient (lineární korelační koeficient) |
V r=0 neexistuje žádná lineární korelace. V tomto případě se skupinové průměry proměnných shodují s jejich obecnými průměry a regresní přímky jsou rovnoběžné se souřadnicovými osami.
Rovnost r=0 hovoří pouze o absenci lineární korelační závislosti (nekorelované proměnné), nikoli však obecně o absenci korelace, a tím spíše o statistické závislosti.
Někdy je závěr, že neexistuje žádná korelace, důležitější než přítomnost silné korelace. Nulová korelace dvou proměnných může naznačovat, že neexistuje žádný vliv jedné proměnné na druhou, za předpokladu, že výsledkům měření důvěřujeme.
V SPSS: 11.3.2 Korelační koeficienty
Doposud jsme zjišťovali pouze samotný fakt existence statistického vztahu mezi dvěma znaky. Dále se pokusíme zjistit, jaké závěry lze vyvodit o síle či slabosti této závislosti, jakož i o její formě a směru. Kritéria pro kvantifikaci vztahu mezi proměnnými se nazývají korelační koeficienty nebo míry konektivity. Dvě proměnné jsou pozitivně korelované, pokud mezi nimi existuje přímý, jednosměrný vztah. V jednosměrném vztahu malé hodnoty jedné proměnné odpovídají malým hodnotám druhé proměnné, velké hodnoty odpovídají velkým. Dvě proměnné jsou negativně korelované, pokud mezi nimi existuje inverzní vztah. U vícesměrného vztahu odpovídají malé hodnoty jedné proměnné velkým hodnotám druhé proměnné a naopak. Hodnoty korelačních koeficientů jsou vždy v rozsahu od -1 do +1.
Jako korelační koeficient mezi proměnnými patřícími do ordinální stupnice se používá Spearmanův koeficient a pro proměnné patřící do intervalové stupnice Pearsonův korelační koeficient (moment součinů). V tomto případě je třeba poznamenat, že každou dichotomickou proměnnou, tedy proměnnou patřící do nominální stupnice a mající dvě kategorie, lze považovat za ordinální.
Nejprve ověříme, zda existuje korelace mezi proměnnými pohlaví a psychiky ze souboru studium.sav. Přitom bereme v úvahu, že dichotomickou proměnnou pohlaví lze považovat za ordinální proměnnou. Udělej následující:
Vyberte z příkazové nabídky Analyzovat (Analýza) Popisná statistika (Popisná statistika) Křížové tabulky... (Kontingenční tabulky)
· Přesunout proměnnou pohlaví do seznamu řádků a proměnnou psychika do seznamu sloupců.
· Klepněte na tlačítko Statistika.... V dialogu Křížové tabulky: Statistika zaškrtněte políčko Korelace. Svou volbu potvrďte tlačítkem Pokračovat.
· V dialogu Křížové tabulky zastavte zobrazování tabulek zaškrtnutím políčka Potlačit tabulky. Klepněte na tlačítko OK.
Budou vypočítány Spearmanovy a Pearsonovy korelační koeficienty a bude testována jejich významnost:
/ SPSS 10
Úkol číslo 10 Korelační analýza
Pojem korelace
Korelace neboli korelační koeficient je statistický ukazatel pravděpodobnostní vztahy mezi dvěma proměnnými měřenými na kvantitativních škálách. Na rozdíl od funkčního zapojení, ve kterém každá hodnota jedné proměnné odpovídá přísně definované hodnota jiné proměnné, pravděpodobnostní spojení vyznačující se tím, že každé hodnotě jedné proměnné odpovídá soubor hodnot Další proměnná Příkladem pravděpodobnostního vztahu je vztah mezi výškou a hmotností lidí. Je jasné, že lidé různé hmotnosti mohou mít stejnou výšku a naopak.
Korelace je hodnota mezi -1 a + 1 a označuje se písmenem r. Navíc, pokud je hodnota blíže 1, znamená to přítomnost silného spojení, a pokud je blíže 0, pak slabé. Hodnota korelace menší než 0,2 je považována za slabou korelaci, více než 0,5 za vysokou. Pokud je korelační koeficient záporný, znamená to, že existuje inverzní vztah: čím vyšší je hodnota jedné proměnné, tím nižší je hodnota druhé.
V závislosti na přijatých hodnotách koeficientu r lze rozlišit různé typy korelace:
Silná pozitivní korelace je určena hodnotou r=1. Výraz „přísný“ znamená, že hodnota jedné proměnné je jednoznačně určena hodnotami jiné proměnné, a výraz „ pozitivní" -že s rostoucí hodnotou jedné proměnné roste i hodnota druhé proměnné.
Striktní korelace je matematickou abstrakcí a ve skutečném výzkumu se téměř nikdy nevyskytuje.
pozitivní korelace odpovídá hodnotám 0
Nedostatek korelace je určena hodnotou r=0. Korelační koeficient nula znamená, že hodnoty proměnných spolu nijak nesouvisí.
Nedostatek korelace H Ó : 0 r xy =0 formulováno jako reflexe nula hypotézy v korelační analýze.
negativní korelace: -1
Silná negativní korelace určeno hodnotou r= -1. Stejně jako přísná pozitivní korelace je abstrakcí a nenachází výraz v praktickém výzkumu.
stůl 1
Typy korelací a jejich definice
Způsob výpočtu korelačního koeficientu závisí na typu stupnice, na které se hodnoty proměnné měří.
Korelační koeficient rPearson je hlavní a lze jej použít pro proměnné s nominálními a částečně uspořádanými intervalovými stupnicemi, jejichž rozložení hodnot odpovídá normálu (korelace momentů součinu). Pearsonův korelační koeficient poskytuje poměrně přesné výsledky i v případech abnormálního rozdělení.
Pro rozdělení, která nejsou normální, je vhodnější použít Spearmanův a Kendallův koeficient pořadové korelace. Jsou seřazeny, protože program předem řadí korelované proměnné.
Program SPSS vypočítává r-Spearmanovu korelaci následovně: nejprve se proměnné převedou na pořadí a poté se na pořadí použije Pearsonův vzorec.
Korelace navržená M. Kendallem je založena na myšlence, že směr spojení lze posoudit porovnáním subjektů ve dvojicích. Pokud se u dvojice subjektů změna X shoduje ve směru se změnou Y, pak to ukazuje na pozitivní vztah. Pokud se to neshoduje, tak o negativním vztahu. Tento koeficient využívají především psychologové pracující s malými vzorky. Protože sociologové pracují s velkými datovými poli, je obtížné třídit páry, identifikovat rozdíl v relativních četnostech a inverzích všech párů subjektů ve vzorku. Nejběžnější je koeficient. Pearson.
Protože korelační koeficient rPearson je hlavní a lze jej použít (s určitou chybou v závislosti na typu škály a míře abnormality v distribuci) pro všechny proměnné měřené na kvantitativních škálách, zvážíme příklady jeho použití a porovnáme výsledky získané s výsledky měření pomocí jiných korelačních koeficientů.
Vzorec pro výpočet koeficientu r- Pearson:
r xy = ∑ (Xi-Xav)∙(Yi-Yav) / (N-1)∙σ x ∙σ y ∙
Kde: Xi, Yi- Hodnoty dvou proměnných;
Xav, Yav - průměrné hodnoty dvou proměnných;
σ x , σ y jsou standardní odchylky,
N je počet pozorování.
Párové korelace
Rádi bychom například zjistili, jak odpovědi mezi různými typy tradičních hodnot korelují v představách studentů o ideálním působišti (proměnné: a9.1, a9.3, a9.5, a9.7) a dále o poměru liberálních hodnot (a9 .2, a9.4, a9.6, a9.8). Tyto proměnné jsou měřeny na 5-členných uspořádaných škálách.
Používáme postup: „Analýza“, „Korelace“, „Párováno“. Standardně koeficient Pearson se nastavuje v dialogovém okně. Použijeme koeficient Pearson
Testované proměnné se přenesou do výběrového okna: a9.1, a9.3, a9.5, a9.7
Stisknutím tlačítka OK získáme výpočet:
Korelace
a9.1.t. Jak důležité je mít dostatek času na rodinu a osobní život? |
Pearsonova korelace |
||||
Hodnota (2stranná) |
|||||
a9.3.t. Jak důležité je nebát se ztráty zaměstnání? |
Pearsonova korelace |
||||
Hodnota (2stranná) |
|||||
a9.5.t. Jak důležité je mít takového šéfa, který s vámi bude konzultovat to či ono rozhodnutí? |
Pearsonova korelace |
||||
Hodnota (2stranná) |
|||||
a9.7.t. Jak důležité je pracovat v sehraném týmu, cítit se jeho součástí? |
Pearsonova korelace |
||||
Hodnota (2stranná) |
|||||
** Korelace je významná na úrovni 0,01 (oboustranná).
Tabulka kvantitativních hodnot zkonstruované korelační matice
Dílčí korelace:
Nejprve vytvořte párovou korelaci mezi těmito dvěma proměnnými:
Korelace |
|||
c8. Ciťte se blízko k těm, kteří žijí blízko vás, sousedé |
Pearsonova korelace |
||
Hodnota (2stranná) |
|||
c12. Cítit blízkost k jejich rodině |
Pearsonova korelace |
||
Hodnota (2stranná) |
|||
**. Korelace je signifikantní na úrovni 0,01 (2stranná). |
Pak použijeme postup pro konstrukci parciální korelace: "Analýza", "Korelace", "Parciální".
Předpokládejme, že hodnota „Je důležité nezávisle určit a změnit pořadí vaší práce“ ve vztahu k uvedeným proměnným bude rozhodujícím faktorem, pod jehož vlivem dříve identifikovaný vztah zmizí nebo se ukáže jako málo významný. .
Korelace |
||||
Vyloučené proměnné |
c8. Ciťte se blízko k těm, kteří žijí blízko vás, sousedé |
c12. Cítit blízkost k jejich rodině |
||
c16. Cítit blízkost k lidem, kteří mají stejné bohatství jako vy |
c8. Ciťte se blízko k těm, kteří žijí blízko vás, sousedé |
Korelace |
||
Význam (2-stranný) |
||||
c12. Cítit blízkost k jejich rodině |
Korelace |
|||
Význam (2-stranný) |
||||
Jak je patrné z tabulky, vlivem řídící proměnné se vztah mírně snížil: z 0,120 na 0,102. zůstává dostatečně vysoká a umožňuje vyvrátit nulovou hypotézu s nulovou chybou.
Korelační koeficient
Nejpřesnějším způsobem, jak určit těsnost a povahu korelace, je najít korelační koeficient. Korelační koeficient je číslo určené vzorcem:
kde r xy je korelační koeficient;
x i -hodnoty prvního prvku;
i -hodnoty druhého znaku;
Aritmetický průměr hodnot prvního prvku
Aritmetický průměr hodnot druhého prvku
Pro použití vzorce (32) sestrojíme tabulku, která poskytne potřebnou posloupnost při přípravě čísel pro nalezení čitatele a jmenovatele korelačního koeficientu.
Jak je vidět ze vzorce (32), sled akcí je následující: najdeme aritmetické průměry obou znamének x a y, najdeme rozdíl mezi hodnotami znaménka a jeho průměrem (х i - ) a y i - ), pak najdeme jejich součin (х i - ) ( y i - ) – součet posledně jmenovaného dává čitatel korelačního koeficientu. Chcete-li najít jeho jmenovatele, měli byste umocnit rozdíly (x i -) a (y i -), najít jejich součty a extrahovat druhou odmocninu z jejich součinu.
Takže například 31, nalezení korelačního koeficientu podle vzorce (32) může být reprezentováno následovně (Tabulka 50).
Výsledné číslo korelačního koeficientu umožňuje zjistit přítomnost, blízkost a povahu vztahu.
1. Pokud je korelační koeficient nulový, není mezi znaky žádný vztah.
2. Pokud je korelační koeficient roven jedné, je vztah mezi znaky tak velký, že přechází ve funkční.
3. Absolutní hodnota korelačního koeficientu nepřesahuje interval od nuly do jedné:
To umožňuje zaměřit se na těsnost spojení: čím blíže je koeficient nule, tím je spojení slabší a čím blíže k jednotě, tím je spojení bližší.
4. Znaménko korelačního koeficientu "plus" znamená přímou korelaci, znaménko "minus" znamená opak.
Stůl 50
x i | i | (х i - ) | (y i -) | (x i - ) (y i - ) | (х i - )2 | (y i -) 2 |
14,00 | 12,10 | -1,70 | -2,30 | +3,91 | 2,89 | 5,29 |
14,20 | 13,80 | -1,50 | -0,60 | +0,90 | 2,25 | 0,36 |
14,90 | 14,20 | -0,80 | -0,20 | +0,16 | 0,64 | 0,04 |
15,40 | 13,00 | -0,30 | -1,40 | +0,42 | 0,09 | 1,96 |
16,00 | 14,60 | +0,30 | +0,20 | +0,06 | 0,09 | 0,04 |
17,20 | 15,90 | +1,50 | +2,25 | 2,25 | ||
18,10 | 17,40 | +2,40 | +2,00 | +4,80 | 5,76 | 4,00 |
109,80 | 101,00 | 12,50 | 13,97 | 13,94 |
Korelační koeficient vypočítaný v příkladu 31 je tedy r xy = +0,9. nám umožňuje vyvodit následující závěry: existuje korelace mezi velikostí svalové síly pravé a levé ruky u studovaných školáků (koeficient r xy \u003d + 0,9 je nenulový), vztah je velmi blízký (koeficient r xy \u003d + 0,9 se blíží jednotě), korelace je přímá (koeficient r xy = +0,9 je kladný), tj. s nárůstem svalové síly jedné z rukou roste síla ruky druhé.
Při výpočtu korelačního koeficientu a použití jeho vlastností je třeba vzít v úvahu, že závěry dávají správné výsledky, když jsou rysy normálně rozděleny a když je uvažován vztah mezi velkým počtem hodnot obou vlastností.
V uvažovaném příkladu 31 bylo analyzováno pouze 7 hodnot obou vlastností, což samozřejmě pro takové studie nestačí. Zde znovu připomínáme, že příklady v této knize obecně a v této kapitole zvláště mají povahu ilustračních metod, a nikoli podrobného představení jakýchkoli vědeckých experimentů. Výsledkem je, že se bere v úvahu malý počet hodnot vlastností, měření jsou zaokrouhlena - to vše se děje, aby nedošlo k zatemnění myšlenky metody těžkopádnými výpočty.
Zvláštní pozornost by měla být věnována podstatě uvažovaného vztahu. Korelační koeficient nemůže vést ke správným výsledkům studie, pokud je analýza vztahu mezi znaky prováděna formálně. Vraťme se k příkladu 31. Oba uvažované znaky byly hodnoty svalové síly pravé a levé ruky. Představme si, že rysem x i v příkladu 31 (14,0; 14,2; 14,9... ...18,1) rozumíme délku náhodně ulovených ryb v centimetrech a prvkem y i (12,1 ; 13,8; 14,2 ... ... 17.4) - hmotnost přístrojů v laboratoři v kilogramech. Formálně, použitím aparatury výpočtů k nalezení korelačního koeficientu a v tomto případě také získání r xy =+0>9, bychom měli dospět k závěru, že existuje úzký vztah přímé povahy mezi délkou ryby a hmotností ryby. nástroje. Absurdita takového závěru je zřejmá.
Abychom se vyhnuli formálnímu přístupu k používání korelačního koeficientu, je třeba použít jakoukoli jinou metodu - matematickou, logickou, experimentální, teoretickou - k identifikaci možnosti korelace mezi znaky, tedy k detekci organické jednoty znaků. Teprve potom lze začít používat korelační analýzu a stanovit velikost a povahu vztahu.
V matematické statistice existuje také pojem vícenásobná korelace- Vztahy mezi třemi nebo více funkcemi. V těchto případech se používá vícenásobný korelační koeficient, skládající se z výše popsaných párových korelačních koeficientů.
Například korelační koeficient tří znaků - x і , y і , z і - je:
kde R xyz -násobný korelační koeficient vyjadřující, jak znak xi závisí na vlastnostech yi a zi;
r xy -korelační koeficient mezi znaky x i a y i ;
r xz - korelační koeficient mezi znaky Xi a Zi;
r yz - korelační koeficient mezi znaky y i , z i
Korelační analýza je:
Korelační analýzaKorelace- statistický vztah dvou nebo více náhodných proměnných (nebo proměnných, které lze za takové považovat s určitou přijatelnou mírou přesnosti). Zároveň změny jedné nebo více těchto veličin vedou k systematické změně druhé nebo jiných veličin. Korelační koeficient slouží jako matematické měřítko korelace dvou náhodných veličin.
Korelace může být kladná i záporná (je také možné, že neexistuje statistický vztah – např. pro nezávislé náhodné veličiny). negativní korelace - korelace, kdy nárůst jedné proměnné je spojen s poklesem jiné proměnné, přičemž korelační koeficient je záporný. pozitivní korelace - korelace, ve které je nárůst jedné proměnné spojen se zvýšením jiné proměnné, přičemž korelační koeficient je kladný.
autokorelaci - statistický vztah mezi náhodnými veličinami ze stejné řady, ale braný s posunem např. pro náhodný proces - s posunem v čase.
Nazývá se metoda zpracování statistických dat, která spočívá ve studiu koeficientů (korelací) mezi proměnnými korelační analýza.
Korelační koeficient
Korelační koeficient nebo párový korelační koeficient v teorii pravděpodobnosti a statistice je to indikátor povahy změny dvou náhodných veličin. Korelační koeficient je označen latinským písmenem R a může nabývat hodnot mezi -1 a +1. Pokud je hodnota modulo blíže 1, pak to znamená přítomnost silného spojení (s korelačním koeficientem rovným jedné hovoří o funkčním spojení), a pokud je blíže 0, pak slabé.
Pearsonův korelační koeficient
Pro metrické veličiny se používá Pearsonův korelační koeficient, jehož přesný vzorec zavedl Francis Galton:
Nechat X,Y- dvě náhodné proměnné definované na stejném pravděpodobnostním prostoru. Pak je jejich korelační koeficient dán vzorcem:
![](https://i0.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
![](https://i1.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
kde cov je kovariance a D je rozptyl nebo ekvivalentně,
,kde symbol označuje matematické očekávání.
Pro grafické znázornění takového vztahu můžete použít pravoúhlý souřadnicový systém s osami, které odpovídají oběma proměnným. Každá dvojice hodnot je označena specifickým symbolem. Takovému spiknutí se říká „rozptyl“.
Způsob výpočtu korelačního koeficientu závisí na typu škály, na kterou se proměnné vztahují. Pro měření proměnných s intervalovými a kvantitativními stupnicemi je tedy nutné použít Pearsonův korelační koeficient (korelaci momentů součinu). Pokud alespoň jedna ze dvou proměnných má ordinální stupnici nebo není normálně rozdělena, musí se použít Spearmanova hodnostní korelace nebo Kendalovo τ (tau). V případě, že jedna ze dvou proměnných je dichotomická, použije se bodová dvouřadá korelace, a pokud jsou obě proměnné dichotomické, použije se korelace čtyř polí. Výpočet korelačního koeficientu mezi dvěma nedichotomickými proměnnými má smysl pouze v případě, že vztah mezi nimi je lineární (jednosměrný).
Kendellův korelační koeficient
Používá se k měření vzájemné neuspořádanosti.
Spearmanův korelační koeficient
Vlastnosti korelačního koeficientu
- Cauchy - Bunyakovsky nerovnost:
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
Korelační analýza
Korelační analýza- způsob zpracování statistických dat, který spočívá ve studiu koeficientů ( korelace) mezi proměnnými. V tomto případě se porovnávají korelační koeficienty mezi jedním párem nebo více páry znaků, aby se mezi nimi stanovily statistické vztahy.
cílová korelační analýza- poskytnout nějaké informace o jedné proměnné pomocí jiné proměnné. V případech, kdy je možné dosáhnout cíle, říkáme, že proměnné korelát. V nejobecnější podobě přijetí hypotézy o přítomnosti korelace znamená, že ke změně hodnoty proměnné A dojde současně s proporcionální změnou hodnoty B: pokud obě proměnné rostou, pak korelace je pozitivní pokud jedna proměnná roste a druhá klesá, korelace je negativní.
Korelace odráží pouze lineární závislost veličin, ale neodráží jejich funkční spojitost. Vypočítáme-li například korelační koeficient mezi hodnotami A = sin(X) a B = CÓs(X), pak se bude blížit nule, tj. mezi veličinami není žádná závislost. Mezitím jsou veličiny A a B zjevně funkčně propojeny podle zákona sin 2(X) + CÓs 2(X) = 1.
Omezení korelační analýzy
![](https://i1.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
![](https://i0.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
- Aplikace je možná, pokud existuje dostatečný počet případů ke studiu: pro konkrétní typ korelačního koeficientu se pohybuje od 25 do 100 párů pozorování.
- Druhé omezení vyplývá z hypotézy korelační analýzy, která zahrnuje lineární závislost proměnných. V mnoha případech, kdy je spolehlivě známo, že závislost existuje, nemusí korelační analýza poskytnout výsledky jednoduše proto, že závislost je nelineární (vyjádřená např. jako parabola).
- Fakt korelace sám o sobě nedává důvod k tvrzení, která z proměnných předchází nebo způsobuje změny, nebo že proměnné spolu obecně kauzálně souvisí, například působením třetího faktoru.
Oblast použití
Tento způsob zpracování statistických dat je velmi populární v ekonomii a společenských vědách (zejména v psychologii a sociologii), ačkoli rozsah použití korelačních koeficientů je široký: kontrola kvality průmyslových výrobků, metalurgie, zemědělská chemie, hydrobiologie, biometrie, a další.
Oblíbenost metody je dána dvěma body: korelační koeficienty se dají poměrně snadno vypočítat, jejich aplikace nevyžaduje speciální matematické školení. V kombinaci se snadnou interpretací vedla snadná aplikace koeficientu k jeho širokému použití v oblasti statistické analýzy dat.
falešná korelace
Často lákavá jednoduchost korelační studie povzbuzuje výzkumníka k vyvozování falešných intuitivních závěrů o přítomnosti kauzálního vztahu mezi dvojicemi znaků, zatímco korelační koeficienty zakládají pouze statistické vztahy.
V moderní kvantitativní metodologii společenských věd ve skutečnosti došlo k opuštění pokusů stanovit kauzální vztahy mezi pozorovanými proměnnými empirickými metodami. Proto, když vědci v sociálních vědách mluví o vytváření vztahů mezi proměnnými, které studují, předpokládá se buď obecný teoretický předpoklad, nebo statistická závislost.
viz také
- Autokorelační funkce
- Křížová korelační funkce
- kovariance
- Koeficient determinace
- Regresní analýza
Nadace Wikimedia. 2010.
Různé funkce mohou souviset.
Jsou mezi nimi 2 typy spojení:
- funkční;
- korelace.
Korelace přeloženo do ruštiny - nic jiného než spojení.
V případě korelace existuje korespondence několika hodnot jednoho atributu s několika hodnotami jiného atributu. Jako příklady můžeme uvažovat zjištěné korelace mezi:
- délka tlapek, krku, zobáku u ptáků, jako jsou volavky, jeřábi, čápi;
- ukazatele tělesné teploty a srdeční frekvence.
U většiny biomedicínských procesů byla přítomnost tohoto typu spojení statisticky prokázána.
Statistické metody umožňují zjistit skutečnost existence vzájemné závislosti znaků. Použití speciálních výpočtů k tomu vede ke stanovení korelačních koeficientů (míry konektivity).
Takové výpočty se nazývají korelační analýza. Provádí se pro potvrzení závislosti 2 proměnných (náhodných veličin) na sobě, která je vyjádřena korelačním koeficientem.
Použití korelační metody nám umožňuje vyřešit několik problémů:
- identifikovat vztah mezi analyzovanými parametry;
- znalost přítomnosti korelace umožňuje řešení prognostických problémů. Existuje tedy reálná možnost předpovídat chování parametru na základě analýzy chování jiného korelovaného parametru;
- klasifikace založená na výběru vlastností nezávislých na sobě.
Pro proměnné:
- ve vztahu k ordinální stupnici se vypočítá Spearmanův koeficient;
- vztahující se k intervalové škále - Pearsonův koeficient.
Toto jsou nejčastěji používané parametry, ale existují i jiné.
Hodnotu koeficientu lze vyjádřit kladně i záporně.
V prvním případě je s nárůstem hodnoty jedné proměnné pozorován nárůst druhé. Se záporným koeficientem je vzor obrácený.
K čemu je korelační koeficient?
Náhodné proměnné navzájem spojené mohou mít zcela odlišný charakter tohoto spojení. Nemusí to být nutně funkční v případě, kdy existuje přímá úměra mezi veličinami. Nejčastěji jsou obě veličiny ovlivněny celým souborem různých faktorů, v případech, kdy jsou společné pro obě veličiny, je pozorován vznik souvisejících vzorů.
To znamená, že statisticky prokázaná skutečnost existence vztahu mezi veličinami není potvrzením, že byla zjištěna příčina pozorovaných změn. Zpravidla dochází k závěru, že existují dva vzájemně související důsledky.
Vlastnosti korelačního koeficientu
Tato statistika má následující vlastnosti:
- hodnota koeficientu se pohybuje od -1 do +1. Čím blíže k extrémním hodnotám, tím silnější je pozitivní nebo negativní vztah mezi lineárními parametry. V případě nulové hodnoty hovoříme o absenci korelace mezi znaky;
- kladná hodnota koeficientu ukazuje, že v případě zvýšení hodnoty jednoho atributu je pozorován nárůst druhého (pozitivní korelace);
- negativní hodnota - v případě zvýšení hodnoty jednoho atributu je pozorován pokles druhého (negativní korelace);
- přiblížení se hodnotě indikátoru k extrémním bodům (buď -1 nebo +1) indikuje přítomnost velmi silné lineární závislosti;
- znakové ukazatele se mohou měnit s konstantní hodnotou koeficientu;
- korelační koeficient je bezrozměrná veličina;
- přítomnost korelace není povinným potvrzením příčinné souvislosti.
Hodnoty korelačních koeficientů
Sílu korelace lze charakterizovat použitím Cheldokovy škály, ve které kvalitativní charakteristika odpovídá určité číselné hodnotě.
V případě kladné korelace na hodnotě:
- 0-0,3 - korelace je velmi slabá;
- 0,3-0,5 - slabý;
- 0,5-0,7 - střední pevnost;
- 0,7-0,9 - vysoká;
- 0,9-1 - velmi vysoká korelační síla.
Škálu lze také použít pro negativní korelaci. V tomto případě jsou kvalitativní charakteristiky nahrazeny opačnými.
Můžete použít zjednodušenou Cheldokovu stupnici, ve které se rozlišují pouze 3 stupně síly korelace:
- velmi silné - ukazatele ± 0,7 - ± 1;
- průměr - ukazatele ± 0,3 - ± 0,699;
- velmi slabé - ukazatele 0 - ± 0,299.
Tento statistický ukazatel umožňuje nejen otestovat předpoklad existence lineárního vztahu mezi znaky, ale také stanovit jeho sílu.
Typy korelačních koeficientů
Korelační koeficienty lze klasifikovat podle znaménka a hodnoty:
- pozitivní;
- nula;
- negativní.
V závislosti na analyzovaných hodnotách se koeficient vypočítá:
- Pearson;
- Spearman;
- Kendala;
- Fechnerovy znaky;
- konkordance nebo vícenásobná hodnostní korelace.
Pearsonův korelační koeficient se používá k vytvoření přímých vazeb mezi absolutními hodnotami proměnných. V tomto případě by se rozdělení obou řad proměnných měla blížit normálu. Porovnávané proměnné by se měly lišit o stejný počet různých znaků. Stupnice reprezentující proměnné musí být buď intervalová, nebo poměrová.
- přesné stanovení síly korelace;
- srovnání kvantitativních charakteristik.
Použití Pearsonova lineárního korelačního koeficientu má několik nevýhod:
- metoda je nestabilní v případě odlehlých hodnot číselných hodnot;
- pomocí této metody je možné určit sílu korelace pouze pro lineární vztah, pro ostatní typy vzájemných vztahů proměnných by měly být použity metody regresní analýzy.
Ranková korelace je určena Spearmanovou metodou, která umožňuje statisticky studovat vztah mezi jevy. Díky tomuto koeficientu je vypočítána skutečná míra paralelnosti dvou kvantitativně vyjádřených řad znaků a odhadnuta blízkost zjištěného vztahu.
- nevyžaduje přesnou definici hodnoty korelační síly;
- porovnávané ukazatele mají kvantitativní i atributivní hodnoty;
- porovnání řádků prvků s otevřenými variantami hodnot.
Spearmanova metoda se vztahuje k metodám neparametrické analýzy, takže není třeba kontrolovat normalitu rozdělení prvků. Navíc umožňuje porovnávat ukazatele vyjádřené v různých měřítcích. Například porovnání hodnot počtu červených krvinek v určitém objemu krve (průběžná stupnice) a odborné posouzení, vyjádřené v bodech (ordinální stupnice).
Účinnost metody je negativně ovlivněna velkým rozdílem mezi hodnotami porovnávaných hodnot. Metoda je rovněž neúčinná v případech, kdy je naměřená hodnota charakterizována nerovnoměrným rozložením hodnot.
Krok za krokem výpočet korelačního koeficientu v Excelu
Výpočet korelačního koeficientu zahrnuje postupné provádění řady matematických operací.
Výše uvedený vzorec pro výpočet Pearsonova koeficientu ukazuje, jak pracný je tento proces, pokud se provádí ručně.
Využití možností Excelu občas urychlí proces hledání koeficientu.
Stačí se řídit jednoduchým algoritmem akcí:
- představení základních informací - sloupec hodnot x a sloupec hodnot y;
- v nástrojích se vybere a otevře záložka Vzorce;
- na kartě, která se otevře, vyberte "Vložit funkci fx";
- v dialogovém okně, které se otevře, je vybrána statistická funkce "Korel", která umožňuje vypočítat korelační koeficient mezi 2 datovými poli;
- data se zadávají v okně, které se otevře: pole 1 - rozsah hodnot sloupce x (data musí být vybrána), pole 2 - rozsah hodnot sloupce y;
- po stisknutí tlačítka „OK“ se v řádku „hodnota“ objeví výsledek výpočtu koeficientu;
- závěr týkající se přítomnosti korelace mezi 2 soubory dat a její silou.
Korelační model (CM) je výpočtový program, který poskytuje matematickou rovnici, ve které je výsledný ukazatel kvantifikován v závislosti na jednom nebo více ukazatelích.
yx \u003d ao + a1x1
kde: y - ukazatel výkonnosti v závislosti na faktoru x;
x - znak faktoru;
a1 - parametr KM, který ukazuje, jak moc se změní efektivní ukazatel y, když se faktor x změní o jednu, pokud současně všechny ostatní faktory ovlivňující y zůstanou nezměněny;
ao - parametr KM, který ukazuje vliv všech ostatních faktorů na efektivní ukazatel y kromě faktoru x
Při volbě efektivních a faktorových ukazatelů modelu je nutné vzít v úvahu skutečnost, že efektivní ukazatel v řetězci vztahů příčina-následek je na vyšší úrovni než faktorové ukazatele.
Charakteristika korelačního modelu
Po výpočtu parametrů korelačního modelu je vypočítán korelační koeficient.
p - párový korelační koeficient, -1 ≤ p ≤ 1, ukazuje sílu a směr vlivu faktorového ukazatele na efektivní. Čím blíže k 1, tím silnější je vztah, čím blíže k 0, tím slabší vztah. Pokud je korelační koeficient kladný, pak je vztah přímý, pokud je záporný, je inverzní.
Vzorec korelačního koeficientu: pxy \u003d (xy-x * 1 / y) / eh * ey
ex=xx2-(x)2; eu=y2-(y)2
Pokud je CM lineární multifaktoriální, má tvar:
yx \u003d ao + a1x1 + a2x2 + ... + axp
pak se pro něj vypočítá vícenásobný korelační koeficient.
0 ≤ Р ≤ 1 a ukazuje sílu vlivu všech faktorových ukazatelů společně na efektivní faktor.
P \u003d 1- ((uh-uy) 2 / (yi - usr) 2)
Kde: uh - efektivní ukazatel - vypočtená hodnota;
ui - skutečná hodnota;
usr - skutečná hodnota, průměr.
Vypočtená hodnota yx se získá jako výsledek substituce do korelačního modelu místo x1, x2 atd. jejich skutečné hodnoty.
Pro jednofaktorové a vícefaktorové nelineární modely se korelační poměr vypočítá:
1 < m < 1;
Má se za to, že vztah mezi efektivními a faktorovými indikátory zahrnutými v modelu je slabý, pokud je hodnota koeficientu blízkosti souvislosti (m) v rozmezí 0-0,3; pokud 0,3-0,7 - těsnost spojení je průměrná; nad 0,7-1 - spojení je silné.
Protože korelační koeficient (párový) p, korelační koeficient (násobek) P, korelační poměr m jsou pravděpodobnostní hodnoty, pak jsou pro ně vypočteny jejich koeficienty významnosti (určené z tabulek). Pokud jsou tyto koeficienty větší než jejich tabulková hodnota, pak jsou významnými důvody koeficienty těsnosti souvislosti. Pokud jsou koeficienty významnosti těsnosti spoje menší než tabulkové hodnoty, nebo je-li samotný koeficient spoje menší než 0,7, pak nejsou do modelu zahrnuty všechny faktorové ukazatele, které významně ovlivňují výsledek.
Koeficient determinace jasně demonstruje procento faktorových ukazatelů zahrnutých v modelu, které určují tvorbu výsledku.
Je-li koeficient determinace větší než 50, pak model adekvátně popisuje zkoumaný proces, je-li menší než 50, pak je nutné vrátit se do první etapy výstavby a revidovat výběr faktorových ukazatelů pro zařazení do Modelka.
Fisherův koeficient neboli Fisherovo kritérium charakterizuje efektivitu modelu jako celku. Pokud vypočtená hodnota koeficientu překročí tabulkovou hodnotu, pak je sestrojený model vhodný pro analýzu, stejně jako pro plánování indikátorů, výpočty do budoucna. Přibližná tabulková hodnota \u003d 1,5. Pokud je vypočtená hodnota menší než tabulková, je nutné nejprve sestavit model včetně faktorů, které výrazně ovlivňují výsledek. Kromě účinnosti modelu jako celku ovlivňuje významnost každý regresní koeficient. Pokud vypočtená hodnota tohoto koeficientu přesáhla tabulkovou hodnotu, pak bude regresní koeficient významný, pokud bude menší, faktorový ukazatel, pro který se tento koeficient počítá, se ze vzorku odstraní, výpočty začnou znovu, ale bez tohoto faktoru .
Korelační koeficient je míra asociace mezi dvěma proměnnými. Jeho výpočet dává představu o tom, zda existuje vztah mezi dvěma soubory dat. Na rozdíl od regrese korelace neumožňuje předpovídat hodnoty. Výpočet koeficientu je však důležitým krokem v předběžné statistické analýze. Zjistili jsme například, že korelační koeficient mezi úrovní přímých zahraničních investic a růstem HDP je vysoký. To nám dává představu, že pro zajištění prosperity je nutné vytvořit příznivé klima speciálně pro zahraniční podnikatele. Na první pohled ne tak jasný závěr!
Korelace a kauzalita
Možná neexistuje jediná oblast statistiky, která by se tak pevně usadila v našich životech. Korelační koeficient se používá ve všech oblastech veřejného povědomí. Jeho hlavní nebezpečí spočívá v tom, že se o jeho vysokých hodnotách často spekuluje, aby lidi přesvědčili a přiměli je věřit v nějaké závěry. Ve skutečnosti však silná korelace vůbec nenaznačuje kauzální vztah mezi veličinami.
Korelační koeficient: Pearsonův a Spearmanův vzorec
Existuje několik hlavních ukazatelů, které charakterizují vztah mezi dvěma proměnnými. Historicky první je Pearsonův lineární korelační koeficient. Předává se ve škole. Vyvinuli jej K. Pearson a J. Yule na základě práce Fr. Galton. Tento koeficient vám umožňuje vidět vztah mezi racionálními čísly, která se racionálně mění. Je vždy větší než -1 a menší než 1. Záporné číslo označuje nepřímo úměrný vztah. Pokud je koeficient nula, pak mezi proměnnými není žádný vztah. Rovná se kladnému číslu - mezi studovanými veličinami je přímo úměrná závislost. Spearmanův koeficient pořadové korelace umožňuje zjednodušit výpočty vytvořením hierarchie proměnných hodnot.
Vztahy mezi proměnnými
Korelace pomáhá odpovědět na dvě otázky. Za prvé, zda je vztah mezi proměnnými pozitivní nebo negativní. Za druhé, jak silná je závislost. Korelační analýza je mocným nástrojem k získání těchto důležitých informací. Je snadné vidět, že příjmy a výdaje domácností úměrně rostou a klesají. Takový vztah je považován za pozitivní. Naopak, když cena produktu roste, poptávka po něm klesá. Takový vztah se nazývá negativní. Hodnoty korelačního koeficientu jsou mezi -1 a 1. Nula znamená, že mezi studovanými hodnotami není žádný vztah. Čím blíže je indikátor extrémním hodnotám, tím silnější je vztah (negativní nebo pozitivní). Absenci závislosti dokládá koeficient od -0,1 do 0,1. Je třeba si uvědomit, že taková hodnota pouze indikuje absenci lineárního vztahu.
Vlastnosti aplikace
Použití obou ukazatelů podléhá určitým předpokladům. Za prvé, přítomnost silného vztahu neurčuje skutečnost, že jedna hodnota určuje druhou. Klidně může existovat třetí veličina, která definuje každou z nich. Za druhé, vysoký Pearsonův korelační koeficient nenaznačuje kauzální vztah mezi studovanými proměnnými. Za třetí, ukazuje výlučně lineární vztah. Korelace může být použita k vyhodnocení smysluplných kvantitativních dat (např. barometrický tlak, teplota vzduchu) spíše než kategorií, jako je pohlaví nebo oblíbená barva.
Vícenásobný korelační koeficient
Pearson a Spearman zkoumali vztah mezi dvěma proměnnými. Ale co dělat, když jsou tři nebo dokonce více. Zde přichází na scénu vícenásobný korelační koeficient. Například hrubý národní produkt je ovlivněn nejen přímými zahraničními investicemi, ale také měnovou a fiskální politikou státu a také úrovní exportu. Tempo růstu a objem HDP jsou výsledkem vzájemného působení řady faktorů. Je však třeba chápat, že model vícenásobné korelace je založen na řadě zjednodušení a předpokladů. Za prvé, multikolinearita mezi veličinami je vyloučena. Za druhé, vztah mezi závislou proměnnou a proměnnými, které ji ovlivňují, se předpokládá, že je lineární.
Oblasti použití korelační a regresní analýzy
Tato metoda zjišťování vztahu mezi veličinami je široce používána ve statistice. Nejčastěji se používá ve třech hlavních případech:
- Pro testování kauzálních vztahů mezi hodnotami dvou proměnných. V důsledku toho výzkumník doufá, že najde lineární vztah a odvodí vzorec, který popisuje tyto vztahy mezi veličinami. Jejich měrné jednotky se mohou lišit.
- Chcete-li zkontrolovat vztah mezi hodnotami. V tomto případě nikdo neurčuje, která proměnná je závislá. Může se ukázat, že hodnota obou veličin určuje nějaký jiný faktor.
- K odvození rovnice. V tomto případě do něj můžete jednoduše dosadit čísla a zjistit hodnoty neznámé proměnné.
Muž hledající kauzální vztah
Vědomí je uspořádáno tak, že rozhodně potřebujeme vysvětlit události, které se kolem dějí. Člověk neustále hledá souvislost mezi obrazem světa, ve kterém žije, a informacemi, které dostává. Mozek často vytváří řád z chaosu. Snadno vidí kauzální vztah tam, kde žádný není. Vědci se musí konkrétně naučit tento trend překonat. Schopnost vyhodnocovat vztahy mezi daty je v akademické kariéře objektivně zásadní.
Mediální zaujatost
Zvažte, jak může být přítomnost korelace chybně interpretována. Skupina špatně vychovaných britských studentů byla dotázána, zda jejich rodiče kouří. Poté byl test zveřejněn v novinách. Výsledek ukázal silnou korelaci mezi kouřením rodičů a delikvencí jejich dětí. Profesor, který provedl tuto studii, dokonce navrhl umístit varování na krabičky cigaret. S tímto závěrem je však spojena řada problémů. Za prvé, korelace neudává, která z veličin je nezávislá. Proto je docela možné předpokládat, že zhoubný zvyk rodičů je způsoben neposlušností dětí. Za druhé, nelze s jistotou říci, že oba problémy nevznikly kvůli nějakému třetímu faktoru. Například nízkopříjmové rodiny. Je třeba poznamenat emocionální aspekt počátečních závěrů profesora, který studii prováděl. Byl vášnivým odpůrcem kouření. Proto není divu, že takto interpretoval výsledky své studie.
závěry
Nesprávná interpretace korelace jako kauzálního vztahu mezi dvěma proměnnými může vést k trapným výzkumným chybám. Problém je v tom, že leží v samém jádru lidského vědomí. Na této funkci je založeno mnoho marketingových triků. Pochopení rozdílu mezi kauzalitou a korelací vám umožní racionálně analyzovat informace jak v každodenním životě, tak ve vaší profesní kariéře.