Čo je to korelácia v štatistike. Korelačný koeficient je charakteristikou korelačného modelu. Ako interpretovať hodnotu Pearsonovho korelačného koeficientu
![Čo je to korelácia v štatistike. Korelačný koeficient je charakteristikou korelačného modelu. Ako interpretovať hodnotu Pearsonovho korelačného koeficientu](https://i2.wp.com/psyfactor.org/lib/i/Image45.gif)
» Štatistiky
Štatistika a spracovanie údajov v psychológii
(pokračovanie)
Korelačná analýza
Pri štúdiu korelácie pokúste sa zistiť, či existuje nejaký vzťah medzi dvoma ukazovateľmi v tej istej vzorke (napríklad medzi výškou a hmotnosťou detí alebo medzi úrovňou IQ a školským prospechom) alebo medzi dvoma rôznymi vzorkami (napríklad pri porovnávaní párov dvojčiat), a ak tento vzťah existuje, či je nárast jedného ukazovateľa sprevádzaný zvýšením (pozitívna korelácia) alebo znížením (negatívna korelácia) iné.
Inými slovami, korelačná analýza pomáha zistiť, či je možné predpovedať možné hodnoty jedného ukazovateľa, pričom poznáme hodnotu iného.
Doteraz sme pri analyzovaní výsledkov našich skúseností so štúdiom účinkov marihuany zámerne ignorovali taký ukazovateľ, akým je reakčný čas. Medzitým by bolo zaujímavé skontrolovať, či existuje vzťah medzi účinnosťou reakcií a ich rýchlosťou. To by umožnilo napríklad tvrdiť, že čím je človek pomalší, tým presnejšie a efektívnejšie bude jeho konanie a naopak.
Na tento účel možno použiť dve rôzne metódy: parametrickú metódu výpočtu Bravaisovho-Pearsonovho koeficientu (r) a výpočet Spearmanovho poradového korelačného koeficientu (r s), ktorý sa aplikuje na ordinálne dáta, t.j. je neparametrické. Najprv však pochopme, čo je korelačný koeficient.
Korelačný koeficient
Korelačný koeficient je hodnota, ktorá sa môže meniť od +1 do -1. V prípade úplnej pozitívnej korelácie sa tento koeficient rovná plus 1 a v prípade úplnej negatívnej korelácie je mínus 1. Na grafe to zodpovedá priamke prechádzajúcej priesečníkmi hodnoty každého páru údajov:
Ak tieto body nie sú zoradené v priamke, ale tvoria „oblak“, absolútna hodnota korelačného koeficientu bude menšia ako jedna a pri zaokrúhľovaní oblaku sa blíži k nule:
Ak je korelačný koeficient 0, obe premenné sú od seba úplne nezávislé.
V humanitných vedách sa korelácia považuje za silnú, ak je jej koeficient väčší ako 0,60; ak presiahne 0,90, potom sa korelácia považuje za veľmi silnú. Na to, aby bolo možné vyvodiť závery o vzťahoch medzi premennými, má však veľký význam veľkosť vzorky: čím väčšia vzorka, tým spoľahlivejšia je hodnota získaného korelačného koeficientu. Existujú tabuľky s kritickými hodnotami Bravais-Pearsonových a Spearmanových korelačných koeficientov pre rôzny počet stupňov voľnosti (rovná sa počtu párov mínus 2, t.j. n- 2). Iba ak sú korelačné koeficienty väčšie ako tieto kritické hodnoty, možno ich považovať za spoľahlivé. Takže, aby bol korelačný koeficient 0,70 spoľahlivý, do analýzy by sa malo vziať aspoň 8 párov údajov ( h =n-2=6) pri výpočte r (pozri tabuľku 4 v prílohe) a 7 párov údajov (h = n-2= 5) pri výpočte r s (tabuľka 5 v prílohe).
Chcel by som ešte raz zdôrazniť, že podstata týchto dvoch koeficientov je trochu odlišná. Záporný koeficient r naznačuje, že účinnosť je najčastejšie tým vyššia, čím je reakčný čas rýchlejší, pričom pri výpočte koeficientu r s bolo potrebné skontrolovať, či rýchlejšie subjekty reagujú vždy presnejšie a pomalšie subjekty menej presnejšie.
Bravaisov-Pearsonov korelačný koeficient (r) - Ide o parametrický ukazovateľ, pre výpočet ktorého sa porovnáva priemer a smerodajná odchýlka výsledkov dvoch meraní. V tomto prípade sa používa vzorec (pre rôznych autorov môže vyzerať inak)
kde Σ XY- súčet súčinov údajov z každého páru;
n je počet párov;
X - priemer pre danú premennú X;
Y -
priemer pre variabilné údaje Y
Sx-štandardná odchýlka pre rozdelenie X;
Sy-štandardná odchýlka pre rozdelenie pri
Spearmanov koeficient poradovej korelácie ( rs ) - ide o neparametrický ukazovateľ, pomocou ktorého sa snažia odhaliť vzťah medzi radmi zodpovedajúcich veličín v dvoch sériách meraní.
Tento koeficient sa ľahšie vypočíta, ale výsledky sú menej presné ako pri použití r. Je to spôsobené tým, že pri výpočte Spearmanovho koeficientu sa používa poradie údajov a nie ich kvantitatívne charakteristiky a intervaly medzi triedami.
Faktom je, že pri použití korelačného koeficientu Spearmanových radov (r s) kontrolujú len to, či poradie údajov pre ktorúkoľvek vzorku bude rovnaké ako v sérii iných údajov pre túto vzorku, párovo vztiahnuté na prvú (napr. , či budú v rovnakom „poradí“ študentov psychológie aj matematiky, alebo dokonca dvoch rôznych učiteľov psychológie?). Ak je koeficient blízky +1, potom to znamená, že oba rady sa prakticky zhodujú a ak je tento koeficient blízky -1, môžeme hovoriť o úplnom inverznom vzťahu.
Koeficient rs vypočítané podľa vzorca
kde d je rozdiel medzi radmi hodnôt konjugovaných vlastností (bez ohľadu na jeho znamienko) a je to počet párov.
Tento neparametrický test sa zvyčajne používa v prípadoch, keď potrebujete vyvodiť nejaké závery, o ktorých nie je toľko intervaloch medzi údajmi, koľko o nich hodnosti, a tiež vtedy, keď sú distribučné krivky príliš skreslené a neumožňujú použitie parametrických kritérií, ako je koeficient r (v týchto prípadoch môže byť potrebné premeniť kvantitatívne údaje na ordinálne údaje).
Zhrnutie
Zvažovali sme teda rôzne parametrické a neparametrické štatistické metódy používané v psychológii. Naša recenzia bola veľmi povrchná a jej hlavnou úlohou bolo, aby čitateľ pochopil, že štatistiky nie sú také strašidelné, ako sa zdajú, a vyžadujú si hlavne zdravý rozum. Pripomíname, že údaje o „skúsenostiach“, ktorými sme sa tu zaoberali, sú fiktívne a nemôžu slúžiť ako základ pre žiadne závery. Takýto experiment by však stál za vykonanie. Keďže pre tento experiment bola zvolená čisto klasická technika, rovnakú štatistickú analýzu bolo možné použiť v mnohých rôznych experimentoch. V každom prípade sa nám zdá, že sme načrtli niekoľko hlavných smerov, ktoré môžu byť užitočné pre tých, ktorí nevedia, kde začať so štatistickou analýzou výsledkov.
Literatúra
- Godefroy J.Čo je psychológia. - M., 1992.
- Chatillon G., 1977. Statistique en Sciences humaines, Trois-Rivieres, Ed. SMG.
- Gilbert N. 1978. Statistiques, Montreal, Ed. H.R.W.
- Moroney M.J., 1970. Comprendre la statistique, Verviers, Gerard et Cie.
- Siegel S., 1956. Neparametrická štatistika, New York, MacGraw-Hill Book Co.
Tabuľková aplikácia
Poznámky. 1) Pre veľké vzorky alebo hladiny významnosti menšie ako 0,05 si pozrite tabuľky v štatistických učebniciach.
2) Tabuľky hodnôt pre ostatné neparametrické kritériá nájdete v špeciálnych pokynoch (pozri bibliografiu).
Tabuľka 1. Hodnoty kritéria tŠtudent | |
h | 0,05 |
1 | 6,31 |
2 | 2,92 |
3 | 2,35 |
4 | 2,13 |
5 | 2,02 |
6 | 1,94 |
7 | 1,90 |
8 | 1,86 |
9 | 1,83 |
10 | 1,81 |
11 | 1,80 |
12 | 1,78 |
13 | 1,77 |
14 | 1,76 |
15 | 1,75 |
16 | 1,75 |
17 | 1,74 |
18 | 1,73 |
19 | 1,73 |
20 | 1,73 |
21 | 1,72 |
22 | 1,72 |
23 | 1,71 |
24 | 1,71 |
25 | 1,71 |
26 | 1,71 |
27 | 1,70 |
28 | 1,70 |
29 | 1,70 |
30 | 1,70 |
40 | 1,68 |
¥ | 1,65 |
Tabuľka 2. Hodnoty kritéria χ 2 | |
h | 0,05 |
1 | 3,84 |
2 | 5,99 |
3 | 7,81 |
4 | 9,49 |
5 | 11,1 |
6 | 12,6 |
7 | 14,1 |
8 | 15,5 |
9 | 16,9 |
10 | 18,3 |
Tabuľka 3. Spoľahlivé hodnoty Z | |
R | Z |
0,05 | 1,64 |
0,01 | 2,33 |
Tabuľka 4. Spoľahlivé (kritické) hodnoty r | ||
h = (N-2) | p= 0,05 (5%) | |
3 | 0,88 | |
4 | 0,81 | |
5 | 0,75 | |
6 | 0,71 | |
7 | 0,67 | |
8 | 0,63 | |
9 | 0,60 | |
10 | 0,58 | |
11 | 0.55 | |
12 | 0,53 | |
13 | 0,51 | |
14 | 0,50 | |
15 | 0,48 | |
16 | 0,47 | |
17 | 0,46 | |
18 | 0,44 | |
19 | 0,43 | |
20 | 0,42 |
Tabuľka 5. Spoľahlivé (kritické) hodnoty r s | |
h = (N-2) | p = 0,05 |
2 | 1,000 |
3 | 0,900 |
4 | 0,829 |
5 | 0,714 |
6 | 0,643 |
7 | 0,600 |
8 | 0,564 |
10 | 0,506 |
12 | 0,456 |
14 | 0,425 |
16 | 0,399 |
18 | 0,377 |
20 | 0,359 |
22 | 0,343 |
24 | 0,329 |
26 | 0,317 |
28 | 0,306 |
Korelačný koeficient je hodnota, ktorá sa môže meniť od +1 do -1. V prípade úplnej pozitívnej korelácie sa tento koeficient rovná plus 1 (hovoria, že s nárastom hodnoty jednej premennej sa zvyšuje hodnota inej premennej) a pri úplnej negatívnej korelácii - mínus 1 (uvádzajú spätnú väzbu t.j. keď sa hodnoty jednej premennej zvýšia, hodnoty druhej sa znížia).
Príklad 1:
Graf závislosti plachosti a depresie. Ako vidíte, bodky (predmety) nie sú umiestnené náhodne, ale zoraďujú sa okolo jednej čiary a pri pohľade na túto čiaru môžeme povedať, že čím vyššia je u človeka plachosť, tým sú tieto javy depresívnejšie, t.j. sú vzájomne prepojené.
Príklad 2: Graf pre hanblivosť a spoločenskosť. Vidíme, že ako sa plachosť zvyšuje, spoločenskosť klesá. Ich korelačný koeficient je -0,43. Korelačný koeficient väčší od 0 do 1 teda označuje priamo úmerný vzťah (čím viac ... tým viac ...) a koeficient od -1 do 0 naznačuje nepriamo úmerný vzťah (čím viac ... tým menej . ..)
Ak je korelačný koeficient 0, obe premenné sú od seba úplne nezávislé.
korelácia- ide o vzťah, kde sa vplyv jednotlivých faktorov javí len ako trend (v priemere) pri hromadnom sledovaní aktuálnych údajov. Príkladom korelačnej závislosti môže byť závislosť medzi veľkosťou aktív banky a výškou zisku banky, rastom produktivity práce a dĺžkou služby zamestnancov.
Používajú sa dva systémy klasifikácie korelácií podľa ich sily: všeobecný a konkrétny.
Všeobecná klasifikácia korelácií: 1) silná alebo blízka s korelačným koeficientom r> 0,70; 2) stredná na 0,500,70, a nie len korelácia s vysokou úrovňou významnosti.V nasledujúcej tabuľke sú uvedené názvy korelačných koeficientov pre rôzne typy škál.
Dichotomická stupnica (1/0) | Poradová (ordinálna) stupnica | ||
Dichotomická stupnica (1/0) | Pearsonov asociačný koeficient, Pearsonov štvorbunkový konjugačný koeficient. | Biseriálna korelácia | |
Poradová (ordinálna) stupnica | Rank-biseriálna korelácia. | Spearmanov alebo Kendallov koeficient poradovej korelácie. | |
Intervalová a absolútna stupnica | Biseriálna korelácia | Hodnoty intervalovej stupnice sa prevedú na poradia a použije sa koeficient poradia | Pearsonov korelačný koeficient (lineárny korelačný koeficient) |
O r=0 neexistuje lineárna korelácia. V tomto prípade sa skupinové priemery premenných zhodujú s ich všeobecnými priemermi a regresné čiary sú rovnobežné so súradnicovými osami.
Rovnosť r=0 hovorí len o absencii lineárnej korelačnej závislosti (nekorelované premenné), ale nie vo všeobecnosti o absencii korelácie a ešte viac o štatistickej závislosti.
Niekedy je záver, že neexistuje žiadna korelácia, dôležitejší ako prítomnosť silnej korelácie. Nulová korelácia dvoch premenných môže naznačovať, že neexistuje žiadny vplyv jednej premennej na druhú, za predpokladu, že výsledkom meraní dôverujeme.
V SPSS: 11.3.2 Korelačné koeficienty
Doteraz sme zisťovali len samotný fakt existencie štatistického vzťahu medzi dvoma znakmi. Ďalej sa pokúsime zistiť, aké závery možno vyvodiť o sile alebo slabosti tejto závislosti, ako aj o jej forme a smerovaní. Kritériá na kvantifikáciu vzťahu medzi premennými sa nazývajú korelačné koeficienty alebo miery konektivity. Dve premenné sú pozitívne korelované, ak medzi nimi existuje priamy, jednosmerný vzťah. V jednosmernom vzťahu malé hodnoty jednej premennej zodpovedajú malým hodnotám druhej premennej, veľké hodnoty zodpovedajú veľkým. Dve premenné sú negatívne korelované, ak medzi nimi existuje inverzný vzťah. Pri viacsmernom vzťahu malé hodnoty jednej premennej zodpovedajú veľkým hodnotám druhej premennej a naopak. Hodnoty korelačných koeficientov sú vždy v rozmedzí od -1 do +1.
Spearmanov koeficient sa používa ako korelačný koeficient medzi premennými patriacimi do ordinálnej stupnice a Pearsonov korelačný koeficient (moment súčinov) pre premenné patriace do intervalovej stupnice. V tomto prípade je potrebné poznamenať, že každú dichotomickú premennú, teda premennú patriacu do nominálnej stupnice a majúcu dve kategórie, možno považovať za ordinálnu.
Najprv skontrolujeme, či existuje korelácia medzi premennými pohlavia a psychiky zo súboru studium.sav. Berieme pritom do úvahy, že dichotomickú premennú pohlavie možno považovať za ordinálnu premennú. Postupujte takto:
Vyberte z príkazového menu Analyzovať (Analýza) Popisná štatistika (Popisná štatistika) Krížové tabuľky... (Kontingenčné tabuľky)
· Premennú pohlavie presuňte do zoznamu riadkov a premennú psychiku do zoznamu stĺpcov.
· Kliknite na tlačidlo Štatistika.... V dialógovom okne Krížové tabuľky: Štatistika začiarknite políčko Korelácie. Svoj výber potvrďte tlačidlom Pokračovať.
· V dialógovom okne Krížové tabuľky zastavte zobrazovanie tabuliek začiarknutím políčka Potlačiť tabuľky. Kliknite na tlačidlo OK.
Vypočítajú sa Spearmanove a Pearsonove korelačné koeficienty a otestuje sa ich význam:
/ SPSS 10
Úloha číslo 10 Korelačná analýza
Koncept korelácie
Korelačný alebo korelačný koeficient je štatistický ukazovateľ pravdepodobnostný vzťahy medzi dvoma premennými meranými na kvantitatívnych škálach. Na rozdiel od funkčného spojenia, v ktorom každá hodnota jednej premennej zodpovedá prísne definované hodnota inej premennej, pravdepodobnostné spojenie vyznačujúci sa tým, že každej hodnote jednej premennej zodpovedá súbor hodnôtĎalšia premenná, Príkladom pravdepodobnostného vzťahu je vzťah medzi výškou a hmotnosťou ľudí. Je jasné, že ľudia rôznej hmotnosti môžu mať rovnakú výšku a naopak.
Korelácia je hodnota medzi -1 a + 1 a označuje sa písmenom r. Navyše, ak je hodnota bližšia k 1, znamená to prítomnosť silného spojenia, a ak je bližšie k 0, potom slabé. Hodnota korelácie menšia ako 0,2 sa považuje za slabú koreláciu, väčšia ako 0,5 za vysokú. Ak je korelačný koeficient záporný, znamená to, že existuje inverzný vzťah: čím vyššia je hodnota jednej premennej, tým nižšia je hodnota druhej.
V závislosti od akceptovaných hodnôt koeficientu r možno rozlíšiť rôzne typy korelácie:
Silná pozitívna korelácia je určená hodnotou r=1. Výraz „prísny“ znamená, že hodnota jednej premennej je jednoznačne určená hodnotami inej premennej, a výraz „ pozitívne" -že so zvyšujúcou sa hodnotou jednej premennej rastie aj hodnota druhej premennej.
Striktná korelácia je matematickou abstrakciou a v skutočnom výskume sa takmer nikdy nevyskytuje.
pozitívna korelácia zodpovedá hodnotám 0
Nedostatok korelácie je určená hodnotou r=0. Nulový korelačný koeficient naznačuje, že hodnoty premenných spolu nijako nesúvisia.
Nedostatok korelácie H o : 0 r xy =0 formulované ako odraz nulový hypotézy v korelačnej analýze.
negatívna korelácia: -1
Silná negatívna korelácia určená hodnotou r= -1. Rovnako ako striktná pozitívna korelácia je abstrakciou a nenachádza výraz v praktickom výskume.
stôl 1
Typy korelácií a ich definície
Spôsob výpočtu korelačného koeficientu závisí od typu stupnice, na ktorej sa merajú hodnoty premennej.
Korelačný koeficient rPearson je hlavný a možno ho použiť pre premenné s nominálnymi a čiastočne usporiadanými intervalovými stupnicami, ktorých rozloženie hodnôt zodpovedá normálu (korelácia momentov súčinu). Pearsonov korelačný koeficient poskytuje pomerne presné výsledky aj v prípadoch abnormálneho rozdelenia.
Pre distribúcie, ktoré nie sú normálne, je vhodnejšie použiť Spearmanove a Kendallove koeficienty poradovej korelácie. Sú zoradené, pretože program vopred zoradí korelované premenné.
Program SPSS vypočítava r-Spearmanovu koreláciu nasledovne: najprv sa premenné prevedú na poradie a potom sa na poradia použije Pearsonov vzorec.
Korelácia navrhnutá M. Kendallom je založená na myšlienke, že smer spojenia možno posúdiť porovnaním subjektov v pároch. Ak sa u dvojice subjektov zhoduje zmena v X v smere so zmenou v Y, znamená to pozitívny vzťah. Ak sa nezhoduje, tak o negatívnom vzťahu. Tento koeficient využívajú najmä psychológovia pracujúci s malými vzorkami. Keďže sociológovia pracujú s veľkými dátovými poľami, je ťažké triediť páry, identifikovať rozdiel v relatívnych frekvenciách a inverziách všetkých párov subjektov vo vzorke. Najbežnejší je koeficient. Pearson.
Keďže korelačný koeficient rPearson je hlavný a možno ho použiť (s určitou chybou v závislosti od typu škály a úrovne abnormality v distribúcii) pre všetky premenné merané na kvantitatívnych škálach, zvážime príklady jeho použitia a porovnáme výsledky získané s výsledkami meraní pomocou iných korelačných koeficientov.
Vzorec na výpočet koeficientu r- Pearson:
r xy = ∑ (Xi-Xav)∙(Yi-Yav) / (N-1)∙σ x ∙σ y ∙
Kde: Xi, Yi- Hodnoty dvoch premenných;
Xav, Yav - priemerné hodnoty dvoch premenných;
σ x , σ y sú štandardné odchýlky,
N je počet pozorovaní.
Párové korelácie
Chceli by sme napríklad zistiť, ako odpovede medzi rôznymi typmi tradičných hodnôt korelujú v predstavách študentov o ideálnom pracovisku (premenné: a9.1, a9.3, a9.5, a9.7) a potom o pomere liberálnych hodnôt (a9 .2, a9.4, a9.6, a9.8). Tieto premenné sa merajú na 5-členných usporiadaných škálach.
Používame postup: „Analýza“, „Korelácie“, „Párové“. Štandardne koeficient Pearson je nastavený v dialógovom okne. Používame koeficient Pearson
Testované premenné sa prenesú do výberového okna: a9.1, a9.3, a9.5, a9.7
Po stlačení OK dostaneme výpočet:
Korelácie
a9.1.t. Aké dôležité je mať dostatok času na rodinný a osobný život? |
Pearsonova korelácia |
||||
Hodnota (obojstranná) |
|||||
a9.3.t. Aké dôležité je nebáť sa straty zamestnania? |
Pearsonova korelácia |
||||
Hodnota (obojstranná) |
|||||
a9.5.t. Aké dôležité je mať takého šéfa, ktorý sa s vami poradí pri tom či onom rozhodnutí? |
Pearsonova korelácia |
||||
Hodnota (obojstranná) |
|||||
a9.7.t. Aké dôležité je pracovať v zohratom tíme, cítiť sa jeho súčasťou? |
Pearsonova korelácia |
||||
Hodnota (obojstranná) |
|||||
** Korelácia je významná na úrovni 0,01 (obojstranná).
Tabuľka kvantitatívnych hodnôt vytvorenej korelačnej matice
Čiastočné korelácie:
Najprv vytvorte párovú koreláciu medzi týmito dvoma premennými:
Korelácie |
|||
c8. Cíťte sa blízko k tým, ktorí bývajú blízko vás, susedia |
Pearsonova korelácia |
||
Hodnota (obojstranná) |
|||
c12. Cítiť blízkosť ich rodiny |
Pearsonova korelácia |
||
Hodnota (obojstranná) |
|||
**. Korelácia je významná na úrovni 0,01 (obojstranná). |
Potom použijeme postup na konštrukciu parciálnej korelácie: „Analýza“, „Korelácie“, „Čiastočná“.
Predpokladajme, že hodnota „Je dôležité nezávisle určiť a zmeniť poradie vašej práce“ vo vzťahu k uvedeným premenným bude rozhodujúcim faktorom, pod vplyvom ktorého predtým identifikovaný vzťah zmizne alebo sa ukáže ako málo významný. .
Korelácie |
||||
Vylúčené premenné |
c8. Cíťte sa blízko k tým, ktorí bývajú blízko vás, susedia |
c12. Cítiť blízkosť ich rodiny |
||
c16. Cítite blízkosť ľudí, ktorí majú rovnaké bohatstvo ako vy |
c8. Cíťte sa blízko k tým, ktorí bývajú blízko vás, susedia |
Korelácia |
||
Význam (obojstranný) |
||||
c12. Cítiť blízkosť ich rodiny |
Korelácia |
|||
Význam (obojstranný) |
||||
Ako vidno z tabuľky, vplyvom riadiacej premennej sa vzťah mierne znížil: z 0,120 na 0,102. zostáva dostatočne vysoká a umožňuje vyvrátiť nulovú hypotézu s nulovou chybou.
Korelačný koeficient
Najpresnejší spôsob, ako určiť tesnosť a povahu korelácie, je nájsť korelačný koeficient. Korelačný koeficient je číslo určené vzorcom:
kde r xy je korelačný koeficient;
x i -hodnoty prvého znaku;
i -hodnoty druhého znaku;
Aritmetický priemer hodnôt prvého znaku
Aritmetický priemer hodnôt druhého znaku
Aby sme použili vzorec (32), zostrojíme tabuľku, ktorá poskytne potrebnú postupnosť pri príprave čísel na nájdenie čitateľa a menovateľa korelačného koeficientu.
Ako je zrejmé zo vzorca (32), postupnosť akcií je nasledovná: nájdeme aritmetické priemery oboch znamienok x a y, nájdeme rozdiel medzi hodnotami znamienka a jeho priemerom (х i - ) a y i - ), potom nájdeme ich súčin (х i - ) ( y i - ) – ich súčet dáva čitateľa korelačného koeficientu. Ak chcete nájsť jeho menovateľa, mali by ste umocniť rozdiely (x i -) a (y i -), nájsť ich súčty a vybrať druhú odmocninu z ich súčinu.
Takže napríklad 31 nájdenie korelačného koeficientu podľa vzorca (32) možno znázorniť nasledovne (tabuľka 50).
Výsledné číslo korelačného koeficientu umožňuje zistiť prítomnosť, blízkosť a povahu vzťahu.
1. Ak je korelačný koeficient nulový, medzi znakmi nie je vzťah.
2. Ak je korelačný koeficient rovný jednej, vzťah medzi znakmi je taký veľký, že sa zmení na funkčný.
3. Absolútna hodnota korelačného koeficientu nepresahuje interval od nuly do jednej:
To umožňuje zamerať sa na tesnosť spojenia: čím je koeficient bližšie k nule, tým je spojenie slabšie a čím bližšie k jednote, tým je spojenie bližšie.
4. Znamienko korelačného koeficientu „plus“ znamená priamu koreláciu, znamienko „mínus“ znamená opak.
Tabuľka 50
x i | i | (х i - ) | (y i -) | (x i - ) (y i - ) | (х i - )2 | (y i -)2 |
14,00 | 12,10 | -1,70 | -2,30 | +3,91 | 2,89 | 5,29 |
14,20 | 13,80 | -1,50 | -0,60 | +0,90 | 2,25 | 0,36 |
14,90 | 14,20 | -0,80 | -0,20 | +0,16 | 0,64 | 0,04 |
15,40 | 13,00 | -0,30 | -1,40 | +0,42 | 0,09 | 1,96 |
16,00 | 14,60 | +0,30 | +0,20 | +0,06 | 0,09 | 0,04 |
17,20 | 15,90 | +1,50 | +2,25 | 2,25 | ||
18,10 | 17,40 | +2,40 | +2,00 | +4,80 | 5,76 | 4,00 |
109,80 | 101,00 | 12,50 | 13,97 | 13,94 |
Korelačný koeficient vypočítaný v príklade 31 je teda r xy = +0,9. nám umožňuje vyvodiť nasledujúce závery: existuje korelácia medzi veľkosťou svalovej sily pravej a ľavej ruky u študovaných školákov (koeficient r xy \u003d + 0,9 je nenulový), vzťah je veľmi blízky (koeficient r xy \u003d + 0,9 sa blíži k jednote), korelácia je priama (koeficient r xy = +0,9 je kladný), t.j. s nárastom svalovej sily jednej ruky sa zvyšuje sila druhej ruky.
Pri výpočte korelačného koeficientu a používaní jeho vlastností je potrebné vziať do úvahy, že závery poskytujú správne výsledky, keď sú znaky normálne rozdelené a keď sa berie do úvahy vzťah medzi veľkým počtom hodnôt oboch znakov.
V uvažovanom príklade 31 bolo analyzovaných iba 7 hodnôt oboch vlastností, čo, samozrejme, na takéto štúdie nestačí. Opäť pripomíname, že príklady v tejto knihe vo všeobecnosti a najmä v tejto kapitole majú charakter ilustračných metód, a nie podrobnú prezentáciu akýchkoľvek vedeckých experimentov. V dôsledku toho sa berie do úvahy malý počet hodnôt vlastností, merania sú zaokrúhlené - to všetko sa robí, aby sa myšlienka metódy nezakryla ťažkopádnymi výpočtami.
Osobitná pozornosť by sa mala venovať podstate posudzovaného vzťahu. Korelačný koeficient nemôže viesť k správnym výsledkom štúdie, ak sa analýza vzťahu medzi znakmi vykonáva formálne. Vráťme sa k príkladu 31. Obidva uvažované znaky boli hodnoty svalovej sily pravej a ľavej ruky. Predstavme si, že znakom x i v príklade 31 (14,0; 14,2; 14,9... ...18,1) rozumieme dĺžku náhodne ulovených rýb v centimetroch a znakom y i (12,1 ; 13,8; 14,2 ... ... 17.4) - hmotnosť prístrojov v laboratóriu v kilogramoch. Formálne, použitím aparatúry výpočtov na nájdenie korelačného koeficientu a v tomto prípade aj získaním r xy =+0>9, by sme mali dospieť k záveru, že existuje úzky vzťah priamej povahy medzi dĺžkou ryby a hmotnosťou ryby. nástroje. Absurdnosť takéhoto záveru je zrejmá.
Aby sme sa vyhli formálnemu prístupu k používaniu korelačného koeficientu, je potrebné použiť akúkoľvek inú metódu – matematickú, logickú, experimentálnu, teoretickú – na identifikáciu možnosti korelácie medzi znakmi, teda na zistenie organickej jednoty znakov. Až potom možno začať používať korelačnú analýzu a určiť veľkosť a povahu vzťahu.
V matematickej štatistike existuje aj pojem viacnásobná korelácia- Vzťahy medzi tromi alebo viacerými funkciami. V týchto prípadoch sa používa viacnásobný korelačný koeficient pozostávajúci z vyššie opísaných párových korelačných koeficientov.
Napríklad korelačný koeficient troch znakov - x і , y і , z і - je:
kde R xyz - viacnásobný korelačný koeficient vyjadrujúci, ako znak x i závisí od znakov y i a z i;
r xy -korelačný koeficient medzi znakmi xi a yi;
r xz - korelačný koeficient medzi znakmi Xi a Zi;
r yz - korelačný koeficient medzi znakmi y i, z i
Korelačná analýza je:
Korelačná analýzaKorelácia- štatistický vzťah dvoch alebo viacerých náhodných premenných (alebo premenných, ktoré možno za také považovať s určitou prijateľnou mierou presnosti). Zmeny jednej alebo viacerých z týchto veličín zároveň vedú k systematickej zmene druhej alebo iných veličín. Korelačný koeficient slúži ako matematická miera korelácie dvoch náhodných premenných.
Korelácia môže byť pozitívna a negatívna (je tiež možné, že neexistuje štatistický vzťah - napríklad pre nezávislé náhodné premenné). negatívna korelácia - korelácia, pri ktorej je nárast jednej premennej spojený s poklesom inej premennej, pričom korelačný koeficient je negatívny. pozitívna korelácia - korelácia, pri ktorej je nárast jednej premennej spojený so zvýšením inej premennej, pričom korelačný koeficient je kladný.
autokorelácia - štatistický vzťah medzi náhodnými premennými z rovnakého radu, ale braný s posunom, napríklad pre náhodný proces - s posunom v čase.
Metóda spracovania štatistických údajov, ktorá spočíva v štúdiu koeficientov (korelácií) medzi premennými, sa nazýva korelačná analýza.
Korelačný koeficient
Korelačný koeficient alebo párový korelačný koeficient v teórii pravdepodobnosti a štatistike je to indikátor charakteru zmeny dvoch náhodných premenných. Korelačný koeficient je označený latinským písmenom R a môže nadobúdať hodnoty medzi -1 a +1. Ak je hodnota modulo bližšia k 1, znamená to prítomnosť silného spojenia (s korelačným koeficientom rovným jednej, hovoria o funkčnom spojení), a ak je bližšie k 0, potom slabé.
Pearsonov korelačný koeficient
Pre metrické veličiny sa používa Pearsonov korelačný koeficient, ktorého presný vzorec zaviedol Francis Galton:
Nechaj X,Y- dve náhodné premenné definované na rovnakom pravdepodobnostnom priestore. Potom je ich korelačný koeficient daný vzorcom:
![](https://i0.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
![](https://i1.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
kde cov je kovariancia a D je rozptyl alebo ekvivalentne,
,kde symbol označuje matematické očakávanie.
Na grafické znázornenie takéhoto vzťahu môžete použiť pravouhlý súradnicový systém s osami, ktoré zodpovedajú obom premenným. Každá dvojica hodnôt je označená špecifickým symbolom. Takáto zápletka sa nazýva „rozptyl“.
Spôsob výpočtu korelačného koeficientu závisí od typu škály, na ktorú sa premenné vzťahujú. Takže na meranie premenných s intervalovými a kvantitatívnymi škálami je potrebné použiť Pearsonov korelačný koeficient (korelácia momentov súčinu). Ak aspoň jedna z dvoch premenných má ordinálnu stupnicu alebo nie je normálne rozložená, musí sa použiť Spearmanova rank korelácia alebo Kendalovo τ (tau). V prípade, že jedna z dvoch premenných je dichotomická, použije sa bodová dvojsériová korelácia a ak sú obe premenné dichotomické, použije sa štvorpoľová korelácia. Výpočet korelačného koeficientu medzi dvoma nedichotomickými premennými má zmysel len vtedy, ak je vzťah medzi nimi lineárny (jednosmerný).
Kendellov korelačný koeficient
Používa sa na meranie vzájomného neporiadku.
Spearmanov korelačný koeficient
Vlastnosti korelačného koeficientu
- Cauchy - Bunyakovsky nerovnosť:
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
Korelačná analýza
Korelačná analýza- spôsob spracovania štatistických údajov, ktorý spočíva v štúdiu koeficientov ( korelácie) medzi premennými. V tomto prípade sa porovnávajú korelačné koeficienty medzi jedným párom alebo viacerými pármi znakov, aby sa medzi nimi stanovili štatistické vzťahy.
Cieľ korelačná analýza- poskytnúť nejaké informácie o jednej premennej pomocou inej premennej. V prípadoch, keď je možné dosiahnuť cieľ, hovoríme, že premenné korelovať. Vo svojej najvšeobecnejšej podobe prijatie hypotézy o prítomnosti korelácie znamená, že zmena hodnoty premennej A nastane súčasne s proporcionálnou zmenou hodnoty B: ak obe premenné rastú, potom korelácia je pozitívna ak jedna premenná rastie a druhá klesá, korelácia je negatívna.
Korelácia odráža len lineárnu závislosť veličín, ale neodráža ich funkčnú súvislosť. Ak napríklad vypočítame korelačný koeficient medzi hodnotami A = sin(X) a B = cos(X), potom sa bude blížiť nule, t.j. medzi veličinami nie je žiadna závislosť. Medzitým sú veličiny A a B zjavne funkčne spojené podľa zákona sin 2(X) + cos 2(X) = 1.
Obmedzenia korelačnej analýzy
![](https://i1.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
![](https://i0.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
- Aplikácia je možná, ak existuje dostatočný počet prípadov na štúdium: pre konkrétny typ korelačného koeficientu sa pohybuje od 25 do 100 párov pozorovaní.
- Druhé obmedzenie vyplýva z hypotézy korelačnej analýzy, ktorá zahŕňa lineárna závislosť premenných. V mnohých prípadoch, keď je spoľahlivo známe, že závislosť existuje, korelačná analýza nemusí poskytnúť výsledky jednoducho preto, že závislosť je nelineárna (vyjadrená napríklad ako parabola).
- Fakt korelácie sám osebe neodôvodňuje tvrdenie, ktorá z premenných predchádza alebo spôsobuje zmeny, alebo že premenné sú vo všeobecnosti navzájom kauzálne spojené, napríklad v dôsledku pôsobenia tretieho faktora.
Oblasť použitia
Tento spôsob spracovania štatistických údajov je veľmi populárny v ekonómii a spoločenských vedách (najmä v psychológii a sociológii), hoci rozsah použitia korelačných koeficientov je široký: kontrola kvality priemyselných výrobkov, hutníctvo, poľnohospodárska chémia, hydrobiológia, biometria, a ďalšie.
Obľúbenosť metódy je spôsobená dvoma bodmi: korelačné koeficienty sa dajú pomerne ľahko vypočítať, ich aplikácia si nevyžaduje špeciálne matematické školenie. V kombinácii s jednoduchosťou interpretácie viedla jednoduchosť aplikácie koeficientu k jeho širokému použitiu v oblasti štatistickej analýzy údajov.
falošná korelácia
Často lákavá jednoduchosť korelačnej štúdie povzbudzuje výskumníka, aby vyvodil falošné intuitívne závery o prítomnosti kauzálneho vzťahu medzi pármi znakov, zatiaľ čo korelačné koeficienty stanovujú iba štatistické vzťahy.
V modernej kvantitatívnej metodológii sociálnych vied sa v skutočnosti upustilo od pokusov o stanovenie kauzálnych vzťahov medzi pozorovanými premennými empirickými metódami. Preto, keď výskumníci v sociálnych vedách hovoria o vytváraní vzťahov medzi premennými, ktoré študujú, znamená to buď všeobecný teoretický predpoklad alebo štatistickú závislosť.
pozri tiež
- Autokorelačná funkcia
- Krížová korelačná funkcia
- kovariancia
- Koeficient determinácie
- Regresná analýza
Nadácia Wikimedia. 2010.
Rôzne funkcie môžu súvisieť.
Sú medzi nimi 2 typy spojenia:
- funkčné;
- korelácia.
Korelácia preložené do ruštiny - nič viac ako spojenie.
V prípade korelácie existuje zhoda niekoľkých hodnôt jedného atribútu s niekoľkými hodnotami iného atribútu. Ako príklad môžeme uvažovať o zistených koreláciách medzi:
- dĺžka labiek, krku, zobáka u vtákov, ako sú volavky, žeriavy, bociany;
- ukazovatele telesnej teploty a srdcovej frekvencie.
Pre väčšinu biomedicínskych procesov bola prítomnosť tohto typu spojenia štatisticky dokázaná.
Štatistické metódy umožňujú zistiť skutočnosť existencie vzájomnej závislosti znakov. Použitie špeciálnych výpočtov na to vedie k stanoveniu korelačných koeficientov (miery konektivity).
Takéto výpočty sú tzv korelačná analýza. Vykonáva sa na potvrdenie závislosti 2 premenných (náhodných premenných) na sebe, ktorá je vyjadrená korelačným koeficientom.
Použitie korelačnej metódy nám umožňuje vyriešiť niekoľko problémov:
- identifikovať vzťah medzi analyzovanými parametrami;
- znalosť prítomnosti korelácie umožňuje riešiť prognostické problémy. Existuje teda reálna možnosť predpovedať správanie parametra na základe analýzy správania iného korelovaného parametra;
- klasifikácia založená na výbere navzájom nezávislých znakov.
Pre premenné:
- vo vzťahu k poradovej stupnici sa vypočíta Spearmanov koeficient;
- súvisí s intervalovou stupnicou - Pearsonovým koeficientom.
Toto sú najčastejšie používané parametre, ale existujú aj iné.
Hodnota koeficientu môže byť vyjadrená kladne aj záporne.
V prvom prípade s nárastom hodnoty jednej premennej sa pozoruje nárast druhej. Pri zápornom koeficiente je vzor obrátený.
Na čo slúži korelačný koeficient?
Náhodné veličiny navzájom spojené môžu mať úplne iný charakter tohto spojenia. Nemusí to byť nevyhnutne funkčné v prípade, keď existuje priamy vzťah medzi množstvami. Najčastejšie sú obe veličiny ovplyvnené celým súborom rôznych faktorov, v prípadoch, keď sú spoločné pre obe veličiny, je pozorovaný vznik súvisiacich vzorov.
To znamená, že štatisticky preukázaná skutočnosť existencie vzťahu medzi veličinami nie je potvrdením, že príčina pozorovaných zmien bola zistená. Výskumník spravidla prichádza k záveru, že existujú dva vzájomne súvisiace dôsledky.
Vlastnosti korelačného koeficientu
Táto štatistika má nasledujúce vlastnosti:
- hodnota koeficientu sa pohybuje od -1 do +1. Čím bližšie k extrémnym hodnotám, tým silnejší je pozitívny alebo negatívny vzťah medzi lineárnymi parametrami. V prípade nulovej hodnoty hovoríme o absencii korelácie medzi znakmi;
- kladná hodnota koeficientu naznačuje, že v prípade zvýšenia hodnoty jedného atribútu je pozorovaný nárast druhého (pozitívna korelácia);
- negatívna hodnota - v prípade zvýšenia hodnoty jedného atribútu sa pozoruje pokles druhého (negatívna korelácia);
- priblíženie hodnoty ukazovateľa ku krajným bodom (buď -1 alebo +1) naznačuje prítomnosť veľmi silného lineárneho vzťahu;
- znakové ukazovatele sa môžu meniť s konštantnou hodnotou koeficientu;
- korelačný koeficient je bezrozmerná veličina;
- prítomnosť korelácie nie je povinným potvrdením príčinnej súvislosti.
Hodnoty korelačných koeficientov
Sila korelácie môže byť charakterizovaná použitím Cheldokovej stupnice, v ktorej kvalitatívna charakteristika zodpovedá určitej číselnej hodnote.
V prípade pozitívnej korelácie pri hodnote:
- 0-0,3 - korelácia je veľmi slabá;
- 0,3-0,5 - slabé;
- 0,5-0,7 - stredná pevnosť;
- 0,7-0,9 - vysoká;
- 0,9-1 - veľmi vysoká sila korelácie.
Stupnicu možno použiť aj na negatívnu koreláciu. V tomto prípade sú kvalitatívne charakteristiky nahradené opačnými.
Môžete použiť zjednodušenú škálu Cheldok, v ktorej sa rozlišujú iba 3 stupne sily korelácie:
- veľmi silné - ukazovatele ± 0,7 - ± 1;
- priemer - ukazovatele ± 0,3 - ± 0,699;
- veľmi slabé - ukazovatele 0 - ± 0,299.
Tento štatistický ukazovateľ umožňuje nielen testovať predpoklad existencie lineárneho vzťahu medzi znakmi, ale aj stanoviť jeho silu.
Typy korelačného koeficientu
Korelačné koeficienty možno klasifikovať podľa znamienka a hodnoty:
- pozitívny;
- nulový;
- negatívne.
V závislosti od analyzovaných hodnôt sa vypočíta koeficient:
- Pearson;
- Spearman;
- Kendala;
- Fechnerove znaky;
- zhoda alebo viacnásobná rank korelácia.
Pearsonov korelačný koeficient sa používa na vytvorenie priamych väzieb medzi absolútnymi hodnotami premenných. V tomto prípade by sa distribúcie oboch sérií premenných mali priblížiť k normálu. Porovnávané premenné by sa mali líšiť o rovnaký počet rôznych znakov. Stupnica reprezentujúca premenné musí byť buď intervalová alebo pomerová.
- presné stanovenie sily korelácie;
- porovnanie kvantitatívnych charakteristík.
Použitie Pearsonovho lineárneho korelačného koeficientu má niekoľko nevýhod:
- metóda je nestabilná v prípade odľahlých hodnôt číselných hodnôt;
- pomocou tejto metódy je možné určiť silu korelácie len pre lineárny vzťah, pre ostatné typy vzájomných vzťahov premenných treba použiť metódy regresnej analýzy.
Ranková korelácia je určená Spearmanovou metódou, ktorá umožňuje štatisticky študovať vzťah medzi javmi. Vďaka tomuto koeficientu sa vypočíta skutočná miera paralelnosti dvoch kvantitatívne vyjadrených radov znakov a odhadne sa aj blízkosť identifikovaného vzťahu.
- nevyžaduje presnú definíciu hodnoty sily korelácie;
- porovnávané ukazovatele majú kvantitatívne aj atribútové hodnoty;
- porovnanie riadkov prvkov s otvorenými variantmi hodnôt.
Spearmanova metóda sa týka metód neparametrickej analýzy, takže nie je potrebné kontrolovať normalitu distribúcie prvkov. Okrem toho umožňuje porovnávať ukazovatele vyjadrené v rôznych mierkach. Napríklad porovnanie hodnôt počtu červených krviniek v určitom objeme krvi (priebežná stupnica) a odborné posúdenie vyjadrené v bodoch (ordinálna stupnica).
Účinnosť metódy negatívne ovplyvňuje veľký rozdiel medzi hodnotami porovnávaných hodnôt. Metóda je neúčinná aj v prípadoch, keď sa nameraná hodnota vyznačuje nerovnomerným rozložením hodnôt.
Krok za krokom výpočet korelačného koeficientu v Exceli
Výpočet korelačného koeficientu zahŕňa postupné vykonávanie množstva matematických operácií.
Vyššie uvedený vzorec na výpočet Pearsonovho koeficientu ukazuje, aký namáhavý je tento proces, ak sa vykonáva ručne.
Využitie možností Excelu občas urýchľuje proces hľadania koeficientu.
Stačí postupovať podľa jednoduchého algoritmu akcií:
- uvedenie základných informácií - stĺpec hodnôt x a stĺpec hodnôt y;
- v nástrojoch sa vyberie a otvorí karta Vzorce;
- na karte, ktorá sa otvorí, vyberte možnosť „Vložiť funkciu fx“;
- v dialógovom okne, ktoré sa otvorí, je vybratá štatistická funkcia "Correl", ktorá umožňuje vypočítať korelačný koeficient medzi 2 poliami údajov;
- údaje sa zadávajú do okna, ktoré sa otvorí: pole 1 - rozsah hodnôt stĺpca x (údaje musia byť vybraté), pole 2 - rozsah hodnôt stĺpca y;
- po stlačení tlačidla „OK“ sa v riadku „hodnota“ zobrazí výsledok výpočtu koeficientu;
- záver týkajúci sa prítomnosti korelácie medzi 2 súbormi údajov a jej silou.
Korelačný model (CM) je výpočtový program, ktorý poskytuje matematickú rovnicu, v ktorej je výsledný ukazovateľ kvantifikovaný v závislosti od jedného alebo viacerých ukazovateľov.
yx \u003d ao + a1x1
kde: y - ukazovateľ výkonnosti v závislosti od faktora x;
x - znak faktora;
a1 - parameter KM, ktorý ukazuje, o koľko sa zmení efektívny ukazovateľ y, keď sa faktor x zmení o jednu, ak súčasne všetky ostatné faktory ovplyvňujúce y zostanú nezmenené;
ao - parameter KM, ktorý ukazuje vplyv všetkých ostatných faktorov na efektívny ukazovateľ y okrem faktora x
Pri výbere efektívnych a faktorových ukazovateľov modelu je potrebné vziať do úvahy skutočnosť, že efektívny ukazovateľ v reťazci vzťahov príčina-následok je na vyššej úrovni ako faktorové ukazovatele.
Charakteristika korelačného modelu
Po výpočte parametrov korelačného modelu sa vypočíta korelačný koeficient.
p - párový korelačný koeficient, -1 ≤ p ≤ 1, ukazuje silu a smer vplyvu faktorového ukazovateľa na efektívny. Čím bližšie k 1, tým silnejší je vzťah, čím bližšie k 0, tým slabší vzťah. Ak je korelačný koeficient kladný, potom je vzťah priamy, ak je záporný, je inverzný.
Vzorec korelačného koeficientu: pxy \u003d (xy-x * 1 / y) / eh * eu
ex=xx2-(x)2; eu=y2-(y)2
Ak je CM lineárny multifaktoriálny, má tvar:
yx \u003d ao + a1x1 + a2x2 + ... + axp
potom sa pre ňu vypočíta viacnásobný korelačný koeficient.
0 ≤ Р ≤ 1 a ukazuje silu vplyvu všetkých faktorových ukazovateľov spolu na efektívny faktor.
P \u003d 1- ((uh-uy) 2 / (yi - usr) 2)
Kde: uh - efektívny ukazovateľ - vypočítaná hodnota;
ui - skutočná hodnota;
usr - skutočná hodnota, priemer.
Vypočítaná hodnota yx sa získa ako výsledok substitúcie do korelačného modelu namiesto x1, x2 atď. ich skutočné hodnoty.
Pre jednofaktorové a viacfaktorové nelineárne modely sa korelačný pomer vypočíta:
1 < m < 1;
Predpokladá sa, že vzťah medzi efektívnymi a faktorovými ukazovateľmi zahrnutými v modeli je slabý, ak je hodnota koeficientu blízkosti spojenia (m) v rozmedzí 0-0,3; ak 0,3-0,7 - tesnosť spojenia je priemerná; nad 0,7-1 - spojenie je silné.
Keďže korelačný koeficient (párový) p, korelačný koeficient (násobok) P, korelačný pomer m sú pravdepodobnostné hodnoty, potom sú pre ne vypočítané ich koeficienty významnosti (určené z tabuliek). Ak sú tieto koeficienty väčšie ako ich tabuľková hodnota, potom sú významnými dôvodmi koeficienty tesnej súvislosti. Ak sú koeficienty významnosti tesnosti spojenia menšie ako tabuľkové hodnoty, alebo ak je samotný koeficient spojenia menší ako 0,7, tak do modelu nie sú zahrnuté všetky faktorové ukazovatele, ktoré výrazne ovplyvňujú výsledok.
Koeficient determinácie jasne demonštruje percento faktorových ukazovateľov zahrnutých v modeli, ktoré určujú tvorbu výsledku.
Ak je koeficient determinácie väčší ako 50, tak model adekvátne popisuje skúmaný proces, ak je menší ako 50, potom je potrebné vrátiť sa do prvej etapy výstavby a zrevidovať výber faktorových ukazovateľov pre zaradenie do tzv. Model.
Fisherov koeficient alebo Fisherovo kritérium charakterizuje efektívnosť modelu ako celku. Ak vypočítaná hodnota koeficientu presiahne tabuľkovú hodnotu, potom je vytvorený model vhodný na analýzu, ako aj ukazovatele plánovania, výpočty do budúcnosti. Približná tabuľková hodnota \u003d 1,5. Ak je vypočítaná hodnota menšia ako tabuľková, je potrebné najprv zostaviť model vrátane faktorov, ktoré výrazne ovplyvňujú výsledok. Okrem účinnosti modelu ako celku každý regresný koeficient ovplyvňuje významnosť. Ak vypočítaná hodnota tohto koeficientu prekročila tabuľkovú hodnotu, potom bude regresný koeficient významný, ak bude menší, faktor faktora, pre ktorý sa tento koeficient počíta, sa zo vzorky odstráni, výpočty začnú odznova, ale bez tohto faktora .
Korelačný koeficient je miera asociácie medzi dvoma premennými. Jeho výpočet poskytuje predstavu o tom, či existuje vzťah medzi dvoma súbormi údajov. Na rozdiel od regresie korelácia neumožňuje predpovedať hodnoty. Výpočet koeficientu je však dôležitým krokom v predbežnej štatistickej analýze. Zistili sme napríklad, že korelačný koeficient medzi úrovňou priamych zahraničných investícií a rastom HDP je vysoký. To nám dáva predstavu, že na zabezpečenie prosperity je potrebné vytvoriť priaznivú klímu špeciálne pre zahraničných podnikateľov. Na prvý pohľad nie taký jasný záver!
Korelácia a kauzalita
Možno neexistuje jediná oblasť štatistiky, ktorá by bola v našich životoch tak pevne zavedená. Korelačný koeficient sa používa vo všetkých oblastiach verejného poznania. Jeho hlavné nebezpečenstvo spočíva v tom, že sa o jeho vysokých hodnotách často špekuluje, aby ľudí presvedčil a prinútil ich veriť v nejaké závery. V skutočnosti však silná korelácia vôbec nenaznačuje kauzálny vzťah medzi veličinami.
Korelačný koeficient: Pearsonov a Spearmanov vzorec
Existuje niekoľko hlavných ukazovateľov, ktoré charakterizujú vzťah medzi dvoma premennými. Historicky prvým je Pearsonov lineárny korelačný koeficient. Odovzdáva sa v škole. Vyvinuli ho K. Pearson a J. Yule na základe práce Fr. Galton. Tento koeficient vám umožňuje vidieť vzťah medzi racionálnymi číslami, ktoré sa racionálne menia. Je vždy väčšia ako -1 a menšia ako 1. Záporné číslo označuje nepriamo úmerný vzťah. Ak je koeficient nula, potom medzi premennými neexistuje žiadny vzťah. Rovná sa kladnému číslu – medzi skúmanými veličinami je priamo úmerný vzťah. Spearmanov koeficient poradovej korelácie umožňuje zjednodušiť výpočty vytvorením hierarchie premenných hodnôt.
Vzťahy medzi premennými
Korelácia pomáha zodpovedať dve otázky. Po prvé, či je vzťah medzi premennými pozitívny alebo negatívny. Po druhé, aká silná je závislosť. Korelačná analýza je mocný nástroj na získanie týchto dôležitých informácií. Je ľahké vidieť, že príjmy a výdavky domácností úmerne rastú a klesajú. Takýto vzťah sa považuje za pozitívny. Naopak, keď cena produktu stúpa, dopyt po ňom klesá. Takýto vzťah sa nazýva negatívny. Hodnoty korelačného koeficientu sú medzi -1 a 1. Nula znamená, že medzi študovanými hodnotami nie je žiadny vzťah. Čím je ukazovateľ bližšie k extrémnym hodnotám, tým je vzťah silnejší (negatívny alebo pozitívny). Absenciu závislosti dokladá koeficient od -0,1 do 0,1. Je potrebné pochopiť, že takáto hodnota iba naznačuje absenciu lineárneho vzťahu.
Funkcie aplikácie
Použitie oboch ukazovateľov podlieha určitým predpokladom. Po prvé, prítomnosť silného vzťahu neurčuje skutočnosť, že jedna hodnota určuje druhú. Môže existovať aj tretia veličina, ktorá definuje každú z nich. Po druhé, vysoký Pearsonov korelačný koeficient nenaznačuje kauzálny vzťah medzi študovanými premennými. Po tretie, ukazuje výlučne lineárny vzťah. Koreláciu možno použiť skôr na vyhodnotenie zmysluplných kvantitatívnych údajov (napr. barometrický tlak, teplota vzduchu) než na kategórie ako pohlavie alebo obľúbená farba.
Viacnásobný korelačný koeficient
Pearson a Spearman skúmali vzťah medzi dvoma premennými. Čo však robiť, ak sú tri alebo dokonca viac. Tu prichádza na scénu viacnásobný korelačný koeficient. Napríklad hrubý národný produkt neovplyvňujú len priame zahraničné investície, ale aj menová a fiškálna politika štátu, ako aj úroveň exportu. Tempo rastu a objem HDP sú výsledkom vzájomného pôsobenia viacerých faktorov. Malo by sa však chápať, že model viacnásobnej korelácie je založený na množstve zjednodušení a predpokladov. Po prvé, multikolinearita medzi veličinami je vylúčená. Po druhé, vzťah medzi závislou premennou a premennými, ktoré ju ovplyvňujú, sa považuje za lineárny.
Oblasti použitia korelačnej a regresnej analýzy
Táto metóda zisťovania vzťahu medzi veličinami je široko používaná v štatistike. Najčastejšie sa používa v troch hlavných prípadoch:
- Na testovanie kauzálnych vzťahov medzi hodnotami dvoch premenných. Výsledkom je, že výskumník dúfa, že nájde lineárny vzťah a odvodí vzorec, ktorý popisuje tieto vzťahy medzi veličinami. Ich merné jednotky sa môžu líšiť.
- Na kontrolu vzťahu medzi hodnotami. V tomto prípade nikto neurčuje, ktorá premenná je závislá. Môže sa ukázať, že hodnota oboch veličín určuje nejaký iný faktor.
- Na odvodenie rovnice. V takom prípade do neho môžete jednoducho nahradiť čísla a zistiť hodnoty neznámej premennej.
Muž hľadajúci kauzálny vzťah
Vedomie je usporiadané tak, že určite musíme vysvetliť udalosti, ktoré sa okolo nás dejú. Človek vždy hľadá súvislosť medzi obrazom sveta, v ktorom žije, a informáciami, ktoré dostáva. Mozog často vytvára poriadok z chaosu. Ľahko vidí kauzálny vzťah tam, kde žiadny nie je. Vedci sa musia špeciálne naučiť prekonať tento trend. Schopnosť vyhodnocovať vzťahy medzi údajmi je v akademickej kariére objektívne nevyhnutná.
Mediálna zaujatosť
Zvážte, ako môže byť prítomnosť korelácie nesprávne interpretovaná. Skupine zle vychovaných britských študentov sa pýtali, či ich rodičia fajčia. Potom bol test uverejnený v novinách. Výsledok ukázal silnú koreláciu medzi fajčením rodičov a delikvenciou ich detí. Profesor, ktorý vykonal túto štúdiu, dokonca navrhol umiestniť varovanie o tomto na škatuľkách cigariet. S týmto záverom však existuje množstvo problémov. Po prvé, korelácia neuvádza, ktoré z veličín je nezávislé. Preto je celkom možné predpokladať, že zhubný zvyk rodičov je spôsobený neposlušnosťou detí. Po druhé, nie je možné s istotou povedať, že oba problémy nevznikli kvôli nejakému tretiemu faktoru. Napríklad rodiny s nízkymi príjmami. Treba poznamenať emocionálny aspekt prvotných záverov profesora, ktorý štúdiu viedol. Bol horlivým odporcom fajčenia. Preto nie je prekvapujúce, že výsledky svojej štúdie interpretoval týmto spôsobom.
závery
Nesprávna interpretácia korelácie ako kauzálneho vzťahu medzi dvoma premennými môže viesť k trápnym výskumným chybám. Problém je v tom, že leží v samom jadre ľudského vedomia. Na tejto funkcii je založených mnoho marketingových trikov. Pochopenie rozdielu medzi kauzalitou a koreláciou vám umožňuje racionálne analyzovať informácie v každodennom živote aj vo vašej profesionálnej kariére.