Mis on korrelatsioon statistikas. Korrelatsioonikordaja on korrelatsioonimudeli tunnusjoon. Kuidas tõlgendada Pearsoni korrelatsioonikordaja väärtust
![Mis on korrelatsioon statistikas. Korrelatsioonikordaja on korrelatsioonimudeli tunnusjoon. Kuidas tõlgendada Pearsoni korrelatsioonikordaja väärtust](https://i2.wp.com/psyfactor.org/lib/i/Image45.gif)
» Statistika
Statistika ja andmetöötlus psühholoogias
(jätk)
Korrelatsioonianalüüs
Õppides korrelatsioonid proovige kindlaks teha, kas kahe sama valimis oleva näitaja vahel on seos (näiteks laste pikkuse ja kaalu või taseme vahel IQ ja koolitulemused) või kahe erineva valimi vahel (näiteks kaksikute paaride võrdlemisel) ning kui see seos on olemas, siis kas ühe näitaja tõusuga kaasneb tulemuste tõus (positiivne korrelatsioon) või langus (negatiivne korrelatsioon). muud.
Teisisõnu, korrelatsioonianalüüs aitab kindlaks teha, kas on võimalik ennustada ühe näitaja võimalikke väärtusi, teades teise väärtust.
Seni oleme marihuaana mõju uurimise kogemuse tulemusi analüüsides teadlikult ignoreerinud sellist näitajat nagu reaktsiooniaeg. Vahepeal oleks huvitav kontrollida, kas reaktsioonide tõhususe ja nende kiiruse vahel on seos. See võimaldaks näiteks väita, et mida aeglasem on inimene, seda täpsem ja tõhusam on tema tegevus ning vastupidi.
Selleks saab kasutada kahte erinevat meetodit: Bravais-Pearsoni koefitsiendi (r) arvutamise parameetrilist meetodit ja Spearmani järgu korrelatsioonikordaja (r s) arvutamist, mida rakendatakse järgandmetele, s.o. on mitteparameetriline. Kuid kõigepealt mõistame, mis on korrelatsioonikordaja.
Korrelatsioonikordaja
Korrelatsioonikordaja on väärtus, mis võib varieeruda vahemikus +1 kuni -1. Täieliku positiivse korrelatsiooni korral on see koefitsient võrdne pluss 1-ga ja täieliku negatiivse korrelatsiooni korral miinus 1. Graafikul vastab see sirgele, mis läbib korrelatsiooni ristumispunkte. iga andmepaari väärtused:
Kui need punktid ei joondu sirgjooneliselt, vaid moodustavad “pilve”, muutub korrelatsioonikordaja absoluutväärtus väiksemaks kui üks ja läheneb pilve ümardamisel nullile:
Kui korrelatsioonikordaja on 0, on mõlemad muutujad üksteisest täiesti sõltumatud.
Humanitaarteadustes loetakse korrelatsiooni tugevaks, kui selle koefitsient on suurem kui 0,60; kui see ületab 0,90, siis peetakse korrelatsiooni väga tugevaks. Et aga muutujatevaheliste seoste kohta järeldusi teha, on suur tähtsus valimi suurusel: mida suurem on valim, seda usaldusväärsem on saadud korrelatsioonikordaja väärtus. Seal on tabelid Bravais-Pearsoni ja Spearmani korrelatsioonikoefitsientide kriitiliste väärtustega erineva arvu vabadusastmete jaoks (see võrdub paaride arvuga miinus 2, s.o. n- 2). Ainult siis, kui korrelatsioonikoefitsiendid on nendest kriitilistest väärtustest suuremad, saab neid pidada usaldusväärseteks. Seega, et korrelatsioonikordaja 0,70 oleks usaldusväärne, tuleks analüüsi võtta vähemalt 8 andmepaari ( h =n-2=6) r arvutamisel (vt tabel 4 lisas) ja 7 andmepaari (h = n-2= 5) r s arvutamisel (lisa tabel 5).
Tahaksin veel kord rõhutada, et nende kahe koefitsiendi olemus on mõnevõrra erinev. Negatiivne koefitsient r näitab, et efektiivsus on enamasti seda kõrgem, seda kiirem on reaktsiooniaeg, kusjuures koefitsiendi r s arvutamisel tuli kontrollida, kas kiiremad katsealused reageerivad alati täpsemalt ja aeglasemad vähem täpselt.
Bravais-Pearsoni korrelatsioonikordaja (r) - See on parameetriline näitaja, mille arvutamiseks võrreldakse kahe mõõtmise tulemuste keskmist ja standardhälvet. Sel juhul kasutatakse valemit (eri autorite puhul võib see välja näha erinev)
kus Σ XY- iga paari andmete korrutiste summa;
n on paaride arv;
X - antud muutuja keskmine x;
Y -
muutuvate andmete keskmine Y
Sx- jaotuse standardhälve X;
Sy- jaotuse standardhälve juures
Spearmani astme korrelatsioonikordaja ( rs ) - see on mitteparameetriline näitaja, mille abil püütakse kahes mõõteseerias paljastada vastavate suuruste ridade vahelist seost.
Seda koefitsienti on lihtsam arvutada, kuid tulemused on vähem täpsed kui r-i kasutamine. Selle põhjuseks on asjaolu, et Spearmani koefitsiendi arvutamisel kasutatakse andmete järjekorda, mitte nende kvantitatiivseid omadusi ja klassidevahelisi intervalle.
Fakt on see, et Spearmani astmete korrelatsioonikordaja (r s) kasutamisel kontrollivad nad ainult seda, kas mis tahes valimi andmete järjestus on sama, mis selle valimi muude andmete rea puhul, mis on paarikaupa seotud esimesega (näiteks , kas nad saavad sama "järjestuse" nii psühholoogia kui matemaatika õpilaste või isegi kahe erineva psühholoogiaõpetajaga?). Kui koefitsient on +1 lähedal, siis see tähendab, et mõlemad seeriad kattuvad praktiliselt ja kui see koefitsient on -1 lähedal, saame rääkida täielikust pöördseost.
Koefitsient rs arvutatakse valemi järgi
kus d on erinevus konjugeeritud tunnuste väärtuste vahel (olenemata selle märgist) ja paaride arv.
Tavaliselt kasutatakse seda mitteparameetrilist testi juhtudel, kui peate tegema järeldusi, mitte niivõrd intervallidega andmete vahel, kui palju nende kohta auastmed, ja ka siis, kui jaotuskõverad on liiga viltu ja ei võimalda kasutada parameetrilisi kriteeriume, nagu koefitsient r (sel juhul võib osutuda vajalikuks kvantitatiivsete andmete muutmine järgandmeteks).
Kokkuvõte
Niisiis oleme kaalunud erinevaid psühholoogias kasutatavaid parameetrilisi ja mitteparameetrilisi statistilisi meetodeid. Meie ülevaade oli väga pealiskaudne ja selle peamiseks ülesandeks oli panna lugeja mõistma, et statistika polegi nii hirmutav, kui tundub, ja eeldab enamasti tervet mõistust. Tuletame meelde, et "kogemuse" andmed, mida me siin käsitlesime, on fiktiivsed ega saa olla järelduste aluseks. Küll aga tasuks selline katse teha. Kuna selle katse jaoks valiti puhtalt klassikaline tehnika, sai sama statistilist analüüsi kasutada paljudes erinevates katsetes. Igal juhul tundub meile, et oleme välja toonud mõned põhisuunad, mis võivad olla kasulikud neile, kes ei tea, kust tulemuste statistilist analüüsi alustada.
Kirjandus
- Godefroy J. Mis on psühholoogia. - M., 1992.
- Chatillon G., 1977. Statistique en Sciences humaines, Trois-Rivieres, toim. SMG.
- Gilbert N. 1978. Statistiques, Montreal, toim. H.R.W.
- Moroney M.J., 1970. Comprendre la statistique, Verviers, Gerard et Cie.
- Siegel S., 1956. Mitteparameetriline statistika, New York, MacGraw-Hill Book Co.
Arvutustabeli rakendus
Märkmed. 1) Suurte valimite või alla 0,05 olulisuse tasemete kohta vaadake statistikaõpikute tabeleid.
2) Muude mitteparameetriliste kriteeriumide väärtuste tabelid leiate erijuhistest (vt bibliograafiat).
Tabel 1. Kriteeriumi väärtused tÜliõpilane | |
h | 0,05 |
1 | 6,31 |
2 | 2,92 |
3 | 2,35 |
4 | 2,13 |
5 | 2,02 |
6 | 1,94 |
7 | 1,90 |
8 | 1,86 |
9 | 1,83 |
10 | 1,81 |
11 | 1,80 |
12 | 1,78 |
13 | 1,77 |
14 | 1,76 |
15 | 1,75 |
16 | 1,75 |
17 | 1,74 |
18 | 1,73 |
19 | 1,73 |
20 | 1,73 |
21 | 1,72 |
22 | 1,72 |
23 | 1,71 |
24 | 1,71 |
25 | 1,71 |
26 | 1,71 |
27 | 1,70 |
28 | 1,70 |
29 | 1,70 |
30 | 1,70 |
40 | 1,68 |
¥ | 1,65 |
Tabel 2. Kriteeriumi χ 2 väärtused | |
h | 0,05 |
1 | 3,84 |
2 | 5,99 |
3 | 7,81 |
4 | 9,49 |
5 | 11,1 |
6 | 12,6 |
7 | 14,1 |
8 | 15,5 |
9 | 16,9 |
10 | 18,3 |
Tabel 3. Usaldusväärsed Z väärtused | |
R | Z |
0,05 | 1,64 |
0,01 | 2,33 |
Tabel 4. R-i usaldusväärsed (kriitilised) väärtused | ||
h = (N-2) | p= 0,05 (5%) | |
3 | 0,88 | |
4 | 0,81 | |
5 | 0,75 | |
6 | 0,71 | |
7 | 0,67 | |
8 | 0,63 | |
9 | 0,60 | |
10 | 0,58 | |
11 | 0.55 | |
12 | 0,53 | |
13 | 0,51 | |
14 | 0,50 | |
15 | 0,48 | |
16 | 0,47 | |
17 | 0,46 | |
18 | 0,44 | |
19 | 0,43 | |
20 | 0,42 |
Tabel 5. R s -i usaldusväärsed (kriitilised) väärtused | |
h = (N-2) | p = 0,05 |
2 | 1,000 |
3 | 0,900 |
4 | 0,829 |
5 | 0,714 |
6 | 0,643 |
7 | 0,600 |
8 | 0,564 |
10 | 0,506 |
12 | 0,456 |
14 | 0,425 |
16 | 0,399 |
18 | 0,377 |
20 | 0,359 |
22 | 0,343 |
24 | 0,329 |
26 | 0,317 |
28 | 0,306 |
Korrelatsioonikordaja on väärtus, mis võib varieeruda vahemikus +1 kuni -1. Täieliku positiivse korrelatsiooni korral on see koefitsient võrdne pluss 1 (nad ütlevad, et ühe muutuja väärtuse suurenemisega suureneb teise muutuja väärtus) ja täieliku negatiivse korrelatsiooni korral - miinus 1 (näidake tagasisidet st kui ühe muutuja väärtused suurenevad, siis teise väärtused vähenevad).
Nt 1:
Häbelikkuse ja depressiooni sõltuvusgraafik. Nagu näete, ei asu punktid (subjektid) juhuslikult, vaid reastuvad ümber ühe joone ja seda joont vaadates võib öelda, et mida suurem on inimeses häbelikkus, seda depressiivsemad, s.t need nähtused on. on omavahel seotud.
2. näide: häbelikkuse ja seltskondlikkuse graafik. Näeme, et häbelikkuse kasvades seltskondlikkus väheneb. Nende korrelatsioonikoefitsient on -0,43. Seega näitab korrelatsioonikordaja, mis on suurem 0 kuni 1, otseselt proportsionaalset seost (mida rohkem ... seda rohkem ...) ja koefitsient vahemikus -1 kuni 0 näitab pöördvõrdelist seost (mida rohkem ... seda vähem . ..)
Kui korrelatsioonikordaja on 0, on mõlemad muutujad üksteisest täiesti sõltumatud.
korrelatsioon- see on seos, kus üksikute tegurite mõju ilmneb ainult trendina (keskmiselt) tegelike andmete massilise vaatlusega. Korrelatsioonisõltuvuse näideteks võib olla sõltuvus panga varade suuruse ja panga kasumi suuruse vahel, tööviljakuse kasv ja töötajate staažikasv.
Korrelatsioonide liigitamiseks nende tugevuse järgi kasutatakse kahte süsteemi: üldine ja eriline.
Korrelatsioonide üldine klassifikatsioon: 1) tugev või lähedane korrelatsioonikoefitsiendiga r> 0,70; 2) keskmine 0,500,70, mitte ainult kõrge olulisuse tasemega korrelatsioon.Järgmises tabelis on loetletud erinevat tüüpi skaalade korrelatsioonikordajate nimetused.
Dihhotoomne skaala (1/0) | Järjekorra (järgu) skaala | ||
Dihhotoomne skaala (1/0) | Pearsoni assotsiatsioonikoefitsient, Pearsoni neljarakuline konjugatsioonikoefitsient. | Biseeriline korrelatsioon | |
Järjekorra (järgu) skaala | Aste-biseeria korrelatsioon. | Spearmani või Kendalli astme korrelatsioonikordaja. | |
Intervall ja absoluutskaala | Biseeriline korrelatsioon | Intervallskaala väärtused teisendatakse auastmeteks ja kasutatakse järgu koefitsienti | Pearsoni korrelatsioonikordaja (lineaarne korrelatsioonikordaja) |
Kell r=0 lineaarne korrelatsioon puudub. Sel juhul langevad muutujate grupikeskmised kokku nende üldiste keskväärtustega ja regressioonisirged on paralleelsed koordinaattelgedega.
Võrdsus r=0 räägib ainult lineaarse korrelatsioonisõltuvuse puudumisest (korrelatsioonita muutujad), kuid mitte üldiselt korrelatsiooni ja veelgi enam statistilise sõltuvuse puudumisest.
Mõnikord on järeldus, et korrelatsioon puudub, olulisem kui tugeva korrelatsiooni olemasolu. Kahe muutuja nullkorrelatsioon võib viidata sellele, et üks muutuja ei mõjuta teist, eeldusel, et me usaldame mõõtmiste tulemusi.
SPSS-is: 11.3.2 Korrelatsioonikordajad
Siiani oleme kahe tunnuse vahelise statistilise seose olemasolu tuvastanud ainult fakti. Järgmisena püüame välja selgitada, milliseid järeldusi saab teha selle sõltuvuse tugevuse või nõrkuse kohta, samuti selle vormi ja suuna kohta. Muutujate vahelise seose kvantifitseerimise kriteeriume nimetatakse korrelatsioonikoefitsientideks või ühenduvuse mõõtudeks. Kaks muutujat on positiivses korrelatsioonis, kui nende vahel on otsene, ühesuunaline seos. Ühesuunalises seoses vastavad ühe muutuja väikesed väärtused teise muutuja väikestele väärtustele, suured väärtused vastavad suurtele. Kaks muutujat on negatiivses korrelatsioonis, kui nende vahel on pöördvõrdeline seos. Mitmesuunalise seose korral vastavad ühe muutuja väikesed väärtused teise muutuja suurtele väärtustele ja vastupidi. Korrelatsioonikoefitsientide väärtused on alati vahemikus -1 kuni +1.
Korrelatsioonikordajana järguskaala kuuluvate muutujate vahel kasutatakse Spearmani koefitsienti ja intervallskaalale kuuluvate muutujate puhul Pearsoni korrelatsioonikordajat (moment of products). Sel juhul tuleb märkida, et iga dihhotoomset muutujat, st nominaalskaalale kuuluvat muutujat, millel on kaks kategooriat, võib pidada järguliseks.
Esiteks kontrollime failist studium.sav, kas soo ja psüühika muutujate vahel on seos. Seejuures võtame arvesse, et dihhotoomset muutujat sugu võib pidada järguliseks muutujaks. Tehke järgmist.
Valige käsumenüüst Analüüsi (Analüüs) Kirjeldav statistika (Kirjeldav statistika) Risttabelid... (Kohtumatuse tabelid)
· Liigutage muutuja sugu ridade loendisse ja muutuja psüühika veergude loendisse.
· Klõpsake nuppu Statistika.... Märkige dialoogiaknas Crosstabs: Statistics ruut Korrelatsioonid. Kinnitage oma valik nupuga Jätka.
· Lõpetage dialoogis Crosstabs tabelite kuvamine, märkides märkeruudu Supress tabelid. Klõpsake nuppu OK.
Spearmani ja Pearsoni korrelatsioonikoefitsiendid arvutatakse ning nende olulisust testitakse:
/ SPSS 10
Ülesanne number 10 Korrelatsioonianalüüs
Korrelatsiooni mõiste
Korrelatsioon ehk korrelatsioonikordaja on statistiline näitaja tõenäosuslik seosed kahe kvantitatiivsel skaalal mõõdetava muutuja vahel. Erinevalt funktsionaalsest ühendusest, milles ühe muutuja iga väärtus vastab rangelt määratletud teise muutuja väärtus, tõenäosuslik seos mida iseloomustab asjaolu, et ühe muutuja iga väärtus vastab väärtuste kogum Teine muutuja, tõenäosusliku seose näide on inimeste pikkuse ja kaalu suhe. On selge, et erineva kaaluga inimesed võivad olla sama pikkusega ja vastupidi.
Korrelatsioon on väärtus vahemikus -1 kuni + 1 ja seda tähistatakse tähega r. Veelgi enam, kui väärtus on lähemal 1-le, tähendab see tugeva ühenduse olemasolu ja kui see on lähemal 0-le, siis nõrka. Korrelatsiooni väärtust alla 0,2 peetakse nõrgaks korrelatsiooniks, üle 0,5 - kõrgeks. Kui korrelatsioonikordaja on negatiivne, tähendab see pöördvõrdelist seost: mida suurem on ühe muutuja väärtus, seda väiksem on teise väärtus.
Sõltuvalt koefitsiendi r aktsepteeritud väärtustest saab eristada erinevat tüüpi korrelatsiooni:
Tugev positiivne korrelatsioon määratakse väärtusega r=1. Mõiste "range" tähendab, et ühe muutuja väärtus on üheselt määratud teise muutuja väärtustega ja termin " positiivne" - et ühe muutuja väärtuse kasvades suureneb ka teise muutuja väärtus.
Range korrelatsioon on matemaatiline abstraktsioon ja seda ei esine reaalses uurimistöös peaaegu kunagi.
positiivne korrelatsioon vastab väärtustele 0
Korrelatsiooni puudumine määratakse väärtusega r=0. Nulli korrelatsioonikordaja näitab, et muutujate väärtused ei ole üksteisega kuidagi seotud.
Korrelatsiooni puudumine H o : 0 r xy =0 sõnastatud peegeldusena null hüpoteesid korrelatsioonianalüüsis.
negatiivne korrelatsioon: -1
Tugev negatiivne korrelatsioon määratud väärtusega r= -1. See, nagu range positiivne korrelatsioon, on abstraktsioon ega leia väljendust praktilises uurimistöös.
Tabel 1
Korrelatsiooni tüübid ja nende määratlused
Korrelatsioonikordaja arvutamise meetod sõltub skaala tüübist, millel muutuja väärtusi mõõdetakse.
Korrelatsioonikordaja rPearson on peamine ja seda saab kasutada nominaalsete ja osaliselt järjestatud intervallskaaladega muutujate jaoks, mille väärtuste jaotus vastab normaalsele (tootemomentide korrelatsioon). Pearsoni korrelatsioonikordaja annab üsna täpsed tulemused ka ebanormaalsete jaotuste korral.
Jaotuste puhul, mis ei ole normaalsed, on eelistatav kasutada Spearmani ja Kendalli auaste korrelatsioonikordajaid. Need on järjestatud, kuna programm seab korrelatsioonimuutujad ette.
SPSS programm arvutab r-Spearmani korrelatsiooni järgmiselt: esmalt teisendatakse muutujad auastmeteks ja seejärel rakendatakse auastmetele Pearsoni valemit.
M. Kendalli pakutud korrelatsioon põhineb ideel, et seose suunda saab hinnata katsealuste paarikaupa võrdlemisel. Kui paari subjekti puhul kattub X-i muutus suunas Y muutusega, siis näitab see positiivset seost. Kui ei klapi, siis negatiivse suhte kohta. Seda koefitsienti kasutavad peamiselt väikeste valimitega töötavad psühholoogid. Kuna sotsioloogid töötavad suurte andmemassiividega, on keeruline paaride kaupa sorteerida, tuvastada kõigi valimi paaride suhteliste sageduste ja inversioonide erinevust. Kõige tavalisem on koefitsient. Pearson.
Kuna korrelatsioonikoefitsient rPearson on peamine ja seda saab kasutada (olenevalt skaala tüübist ja jaotuse ebanormaalsuse tasemest teatud veaga) kõigi kvantitatiivsetel skaaladel mõõdetavate muutujate jaoks, käsitleme selle kasutamise näiteid ja võrdleme muid korrelatsioonikordajaid kasutades tehtud mõõtmistulemustega saadud tulemused.
Koefitsiendi arvutamise valem r- Pearson:
r xy = ∑ (Xi-Xav)∙(Yi-Yav) / (N-1)∙σ x ∙σ y ∙
Kus: Xi, Yi- kahe muutuja väärtused;
Xav, Yav - kahe muutuja keskmised väärtused;
σ x , σ y on standardhälbed,
N on vaatluste arv.
Paarkorrelatsioonid
Näiteks soovime teada saada, kuidas korreleeruvad vastused erinevat tüüpi traditsiooniliste väärtuste vahel õpilaste ideedes ideaalsest töökohast (muutujad: a9.1, a9.3, a9.5, a9.7) ja siis liberaalsete väärtuste suhte kohta (a9 .2, a9.4, a9.6, a9.8). Neid muutujaid mõõdetakse 5-liikmelise järjestatud skaalal.
Kasutame protseduuri: "Analüüs", "Korrelatsioonid", "Paaritud". Vaikimisi koefitsient Pearson on seadistatud dialoogiboksis. Kasutame koefitsienti Pearson
Testitud muutujad kantakse valikuaknasse: a9.1, a9.3, a9.5, a9.7
Vajutades nuppu OK, saame arvutuse:
Korrelatsioonid
a9.1.t. Kui oluline on, et pere- ja isiklikuks eluks jääks piisavalt aega? |
Pearsoni korrelatsioon |
||||
Väärtus (kahepoolne) |
|||||
a9.3.t. Kui oluline on mitte karta töökoha kaotamist? |
Pearsoni korrelatsioon |
||||
Väärtus (kahepoolne) |
|||||
a9.5.t. Kui oluline on selline ülemus, kes selle või teise otsuse tegemisel sinuga nõu peab? |
Pearsoni korrelatsioon |
||||
Väärtus (kahepoolne) |
|||||
a9.7.t. Kui oluline on töötada hästi koordineeritud meeskonnas, tunda end selle osana? |
Pearsoni korrelatsioon |
||||
Väärtus (kahepoolne) |
|||||
** Korrelatsioon on oluline 0,01 tasemel (kahepoolne).
Konstrueeritud korrelatsioonimaatriksi kvantitatiivsete väärtuste tabel
Osalised korrelatsioonid:
Esiteks loome nende kahe muutuja vahel paaripõhise korrelatsiooni:
Korrelatsioonid |
|||
c8. Tundke lähedust nendega, kes teie läheduses elavad, naabrid |
Pearsoni korrelatsioon |
||
Väärtus (kahepoolne) |
|||
c12. Tundke end nende perega lähedal |
Pearsoni korrelatsioon |
||
Väärtus (kahepoolne) |
|||
**. Korrelatsioon on oluline 0,01 tasemel (kahepoolne). |
Seejärel kasutame osakorrelatsiooni konstrueerimise protseduuri: "Analüüs", "Korrelatsioonid", "Osaline".
Oletame, et väärtus “Oluline on iseseisvalt määrata ja muuta oma töö järjekorda” on märgitud muutujate suhtes määravaks teguriks, mille mõjul varem tuvastatud seos kaob või muutub väheoluliseks. .
Korrelatsioonid |
||||
Välistatud muutujad |
c8. Tundke lähedust nendega, kes teie läheduses elavad, naabrid |
c12. Tundke end nende perega lähedal |
||
c16. Tundke lähedust inimestega, kellel on teiega sama rikkus |
c8. Tundke lähedust nendega, kes teie läheduses elavad, naabrid |
Korrelatsioon |
||
Tähtsus (kahepoolne) |
||||
c12. Tundke end nende perega lähedal |
Korrelatsioon |
|||
Tähtsus (kahepoolne) |
||||
Nagu tabelist näha, vähenes seos kontrollmuutuja mõjul veidi: 0,120-lt 0,102-le. see jääb piisavalt kõrgeks ja võimaldab nullhüpoteesi nullveaga ümber lükata.
Korrelatsioonikordaja
Kõige täpsem viis korrelatsiooni tiheduse ja olemuse määramiseks on leida korrelatsioonikordaja. Korrelatsioonikordaja on arv, mis määratakse järgmise valemiga:
kus r xy on korrelatsioonikordaja;
x i - esimese tunnuse väärtused;
i -teise tunnuse väärtused;
Esimese tunnuse väärtuste aritmeetiline keskmine
Teise tunnuse väärtuste aritmeetiline keskmine
Valemi (32) kasutamiseks koostame tabeli, mis annab arvude ettevalmistamisel vajaliku jada korrelatsioonikordaja lugeja ja nimetaja leidmiseks.
Nagu valemist (32) näha, on tegevuste jada järgmine: leiame mõlema märgi x ja y aritmeetilise keskmise, leiame erinevuse märgi väärtuste ja selle keskmise vahel (х i - ) ja y i - ), siis leiame nende korrutise (х i - ) ( y i - ) – viimase summa annab korrelatsioonikordaja lugeja. Selle nimetaja leidmiseks tuleks erinevused (x i -) ja (y i -) ruudustada, leida nende summad ja eraldada nende korrutisest ruutjuur.
Näiteks 31 võib korrelatsioonikordaja leidmist valemiga (32) esitada järgmiselt (tabel 50).
Saadud korrelatsioonikordaja arv võimaldab tuvastada suhte olemasolu, lähedust ja olemust.
1. Kui korrelatsioonikordaja on null, siis tunnuste vahel seost ei ole.
2. Kui korrelatsioonikordaja on võrdne ühega, on tunnuste vaheline seos nii suur, et muutub funktsionaalseks.
3. Korrelatsioonikordaja absoluutväärtus ei ületa intervalli nullist üheni:
See võimaldab keskenduda ühenduse tihedusele: mida lähemal on koefitsient nullile, seda nõrgem on ühendus ja mida lähemal ühtsusele, seda tihedam on ühendus.
4. Korrelatsioonikordaja märk "pluss" tähendab otsest korrelatsiooni, märk "miinus" tähendab vastupidist.
Tabel 50
x i | i | (х i - ) | (ja i - ) | (x i - )(y i - ) | (х i - )2 | (y i - )2 |
14,00 | 12,10 | -1,70 | -2,30 | +3,91 | 2,89 | 5,29 |
14,20 | 13,80 | -1,50 | -0,60 | +0,90 | 2,25 | 0,36 |
14,90 | 14,20 | -0,80 | -0,20 | +0,16 | 0,64 | 0,04 |
15,40 | 13,00 | -0,30 | -1,40 | +0,42 | 0,09 | 1,96 |
16,00 | 14,60 | +0,30 | +0,20 | +0,06 | 0,09 | 0,04 |
17,20 | 15,90 | +1,50 | +2,25 | 2,25 | ||
18,10 | 17,40 | +2,40 | +2,00 | +4,80 | 5,76 | 4,00 |
109,80 | 101,00 | 12,50 | 13,97 | 13,94 |
Seega on näites 31 arvutatud korrelatsioonikordaja r xy = +0,9. võimaldab teha järgmised järeldused: uuritud koolilaste parema ja vasaku käe lihasjõu suuruse vahel on korrelatsioon (koefitsient r xy \u003d + 0,9 on nullist erinev), seos on väga tihe (koefitsient r xy \u003d + 0,9 on ühtsusele lähedane), korrelatsioon on otsene (koefitsient r xy = +0,9 on positiivne), st ühe käe lihasjõu suurenemisega teise käe jõud suureneb.
Korrelatsioonikordaja arvutamisel ja selle omaduste kasutamisel tuleb arvestada, et järeldused annavad õiged tulemused siis, kui tunnused on normaalselt jaotunud ja kui arvestada mõlema tunnuse suure hulga väärtuste vahelist seost.
Vaadeldavas näites 31 analüüsiti mõlema tunnuse ainult 7 väärtust, millest selliste uuringute jaoks loomulikult ei piisa. Tuletame siinkohal veel kord meelde, et selles raamatus üldiselt ja konkreetselt selles peatükis toodud näited on illustreerivad meetodid, mitte mingite teaduslike katsete üksikasjalik esitlus. Selle tulemusel võetakse arvesse väikest hulka tunnuste väärtusi, mõõtmised ümardatakse - kõike seda tehakse selleks, et mitte ähmastada meetodi ideed tülikate arvutustega.
Erilist tähelepanu tuleks pöörata vaadeldava suhte olemusele. Korrelatsioonikordaja ei saa viia uuringu õigete tulemusteni, kui tunnuste vaheliste seoste analüüs viiakse läbi formaalselt. Läheme tagasi näite 31 juurde. Mõlemad märgid olid parema ja vasaku käe lihasjõu väärtused. Kujutame ette, et tunnuse x i all näites 31 (14,0; 14,2; 14,9... ...18,1) peame silmas juhuslikult püütud kala pikkust sentimeetrites ja tunnuse y i all (12,1 ; 13,8; 14,2 ... ... 17.4) - laboris olevate instrumentide kaal kilogrammides. Formaalselt, kasutades korrelatsioonikordaja leidmiseks arvutusaparaati ja sel juhul saades ka r xy =+0>9, oleksime pidanud järeldama, et kala pikkuse ja kala kaalu vahel on otsest laadi tihe seos. instrumendid. Sellise järelduse absurdsus on ilmne.
Et vältida formaalset lähenemist korrelatsioonikordaja kasutamisele, tuleks märkide vahelise korrelatsiooni võimaluse tuvastamiseks, st märkide orgaanilise ühtsuse tuvastamiseks, kasutada mis tahes muud meetodit - matemaatilist, loogilist, eksperimentaalset, teoreetilist. Alles siis saab hakata kasutama korrelatsioonianalüüsi ning kindlaks teha seose ulatuse ja olemuse.
Matemaatilises statistikas on ka mõiste mitmekordne korrelatsioon- Seosed kolme või enama funktsiooni vahel. Nendel juhtudel kasutatakse mitmekordset korrelatsioonikoefitsienti, mis koosneb ülalkirjeldatud paaripõhisest korrelatsioonikoefitsiendist.
Näiteks kolme märgi - x і , y і , z і - korrelatsioonikordaja on:
kus R xyz -mitmekordne korrelatsioonikordaja, mis väljendab, kuidas tunnus x i sõltub tunnustest y i ja z i ;
r xy -korrelatsioonikordaja tunnuste x i ja y i vahel;
r xz - tunnuste Xi ja Zi vaheline korrelatsioonikordaja;
r yz - tunnuste y i, z i korrelatsioonikordaja
Korrelatsioonianalüüs on järgmine:
KorrelatsioonianalüüsKorrelatsioon- kahe või enama juhusliku muutuja (või muutujate, mida võib selliseks pidada teatud aktsepteeritava täpsusastmega) statistiline seos. Samal ajal viivad muutused ühes või mitmes sellises suuruses teise või teiste suuruste süstemaatilise muutumiseni. Korrelatsioonikordaja on kahe juhusliku suuruse korrelatsiooni matemaatiline mõõt.
Korrelatsioon võib olla positiivne ja negatiivne (võimalik on ka, et statistiline seos puudub – näiteks sõltumatute juhuslike suuruste puhul). negatiivne korrelatsioon - korrelatsioon, kus ühe muutuja suurenemine on seotud teise muutuja vähenemisega, samas kui korrelatsioonikordaja on negatiivne. positiivne korrelatsioon - korrelatsioon, kus ühe muutuja suurenemine on seotud teise muutuja suurenemisega, samas kui korrelatsioonikordaja on positiivne.
autokorrelatsioon - statistiline seos sama jada juhuslike muutujate vahel, kuid võetud nihkega, näiteks juhusliku protsessi jaoks - nihkega ajas.
Statistiliste andmete töötlemise meetodit, mis seisneb muutujate vaheliste koefitsientide (korrelatsioonide) uurimises nimetatakse nn. korrelatsioonianalüüs.
Korrelatsioonikordaja
Korrelatsioonikordaja või paari korrelatsioonikordaja tõenäosusteoorias ja statistikas on see kahe juhusliku muutuja muutuse olemuse näitaja. Korrelatsioonikordaja tähistatakse ladina tähega R ja see võib võtta väärtusi vahemikus -1 kuni +1. Kui mooduli väärtus on lähemal 1-le, tähendab see tugeva ühenduse olemasolu (ühega võrdse korrelatsioonikoefitsiendiga räägitakse funktsionaalsest ühendusest) ja kui 0-le lähemal, siis nõrka.
Pearsoni korrelatsioonikordaja
Meetriliste suuruste jaoks kasutatakse Pearsoni korrelatsioonikordajat, mille täpse valemi tutvustas Francis Galton:
Lase X,Y- kaks juhuslikku muutujat, mis on määratletud samas tõenäosusruumis. Seejärel antakse nende korrelatsioonikordaja valemiga:
![](https://i0.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
![](https://i1.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
kus cov on kovariatsioon ja D on dispersioon või samaväärne,
,kus sümbol tähistab matemaatilist ootust.
Sellise seose graafiliseks esitamiseks võite kasutada ristkülikukujulist koordinaatsüsteemi, mille teljed vastavad mõlemale muutujale. Iga väärtuste paar on tähistatud konkreetse sümboliga. Sellist süžeed nimetatakse "hajutusgraafikuks".
Korrelatsioonikordaja arvutamise meetod sõltub skaala tüübist, millele muutujad viitavad. Seega on muutujate mõõtmiseks intervallide ja kvantitatiivsete skaaladega vaja kasutada Pearsoni korrelatsioonikordajat (korrelatsioonimomentide korrelatsioon). Kui vähemalt ühel kahest muutujast on järguskaala või see ei ole normaalselt jaotunud, tuleb kasutada Spearmani järgu korrelatsiooni või Kendali τ (tau). Juhul, kui üks kahest muutujast on dihhotoomne, kasutatakse punkt-kaheseeria korrelatsiooni ja kui mõlemad muutujad on dihhotoomilised, siis neljavälja korrelatsiooni. Kahe mittedihhotoomse muutuja vahelise korrelatsioonikordaja arvutamine on mõttekas ainult siis, kui nendevaheline seos on lineaarne (ühesuunaline).
Kendelli korrelatsioonikordaja
Kasutatakse vastastikuse häire mõõtmiseks.
Spearmani korrelatsioonikordaja
Korrelatsioonikordaja omadused
- Cauchy - Bunyakovsky ebavõrdsus:
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
Korrelatsioonianalüüs
Korrelatsioonianalüüs- statistiliste andmete töötlemise meetod, mis seisneb koefitsientide uurimises ( korrelatsioonid) muutujate vahel. Sel juhul võrreldakse ühe või mitme tunnusepaari vahelisi korrelatsioonikoefitsiente, et teha kindlaks nendevahelised statistilised seosed.
Sihtmärk korrelatsioonianalüüs- anda teavet ühe muutuja kohta teise muutuja abil. Juhtudel, kui eesmärki on võimalik saavutada, ütleme, et muutujad korreleerima. Kõige üldisemal kujul tähendab korrelatsiooni olemasolu hüpoteesi võtmine seda, et muutuja A väärtuse muutus toimub samaaegselt B väärtuse proportsionaalse muutumisega: kui mõlemad muutujad suurenevad, siis korrelatsioon on positiivne kui üks muutuja suureneb ja teine väheneb, korrelatsioon on negatiivne.
Korrelatsioon peegeldab ainult suuruste lineaarset sõltuvust, kuid ei kajasta nende funktsionaalset ühenduvust. Näiteks kui arvutame väärtuste vahelise korrelatsioonikordaja A = sin(x) ja B = cos(x), siis on see nullilähedane, st koguste vahel puudub sõltuvus. Samal ajal on suurused A ja B seaduse järgi ilmselgelt funktsionaalselt seotud sin 2(x) + cos 2(x) = 1.
Korrelatsioonianalüüsi piirangud
![](https://i1.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
![](https://i0.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
- Rakendamine on võimalik, kui uuritavaid juhtumeid on piisav arv: teatud tüüpi korrelatsioonikordaja puhul jääb see vahemikku 25 kuni 100 vaatluspaari.
- Teine piirang tuleneb korrelatsioonianalüüsi hüpoteesist, mis hõlmab muutujate lineaarne sõltuvus. Paljudel juhtudel, kui on usaldusväärselt teada, et sõltuvus on olemas, ei pruugi korrelatsioonianalüüs tulemusi anda lihtsalt seetõttu, et sõltuvus on mittelineaarne (väljendatuna näiteks paraboolina).
- Iseenesest ei anna korrelatsiooni fakt alust väita, milline muutujatest eelneb või põhjustab muutusi või et muutujad on omavahel üldiselt põhjuslikus seoses, näiteks mõne kolmanda teguri toime tõttu.
Kasutusala
See statistiliste andmete töötlemise meetod on majandus- ja sotsiaalteadustes (eriti psühholoogias ja sotsioloogias) väga populaarne, kuigi korrelatsioonikoefitsientide rakendusala on lai: tööstustoodete kvaliteedikontroll, metallurgia, põllumajanduskeemia, hüdrobioloogia, biomeetria, ja teised.
Meetodi populaarsus on tingitud kahest punktist: korrelatsioonikoefitsiente on suhteliselt lihtne arvutada, nende rakendamine ei nõua erilist matemaatilist ettevalmistust. Koos tõlgendamise lihtsusega on koefitsiendi kohaldamise lihtsus kaasa toonud selle laialdase kasutamise statistilise andmeanalüüsi valdkonnas.
võlts korrelatsioon
Korrelatsiooniuuringu sageli ahvatlev lihtsus julgustab uurijat tegema valesid intuitiivseid järeldusi tunnuste paaride vahelise põhjusliku seose olemasolu kohta, samas kui korrelatsioonikordajad loovad ainult statistilisi seoseid.
Sotsiaalteaduste kaasaegses kvantitatiivses metoodikas on tegelikult loobutud katsetest tuvastada empiiriliste meetoditega põhjuslikke seoseid vaadeldavate muutujate vahel. Seega, kui sotsiaalteaduste teadlased räägivad uuritavate muutujate vahel seoste loomisest, siis eeldatakse kas üldist teoreetilist eeldust või statistilist sõltuvust.
Vaata ka
- Autokorrelatsiooni funktsioon
- Ristkorrelatsiooni funktsioon
- kovariatsioon
- Määramiskoefitsient
- Regressioonanalüüs
Wikimedia sihtasutus. 2010. aasta.
Seotud võivad olla erinevad funktsioonid.
Nende vahel on 2 tüüpi ühendusi:
- funktsionaalne;
- korrelatsioon.
Korrelatsioon tõlgitud vene keelde – ei midagi muud kui ühendus.
Korrelatsiooni korral on ühe atribuudi mitme väärtuse vastavus teise atribuudi mitme väärtusega. Näitena võime vaadelda väljakujunenud seoseid:
- käppade, kaela, noka pikkus lindudel, nagu haigur, kured, kured;
- kehatemperatuuri ja südame löögisageduse näitajad.
Enamiku biomeditsiiniliste protsesside puhul on seda tüüpi ühenduse olemasolu statistiliselt tõestatud.
Statistilised meetodid võimaldavad tuvastada tunnuste vastastikuse sõltuvuse olemasolu. Spetsiaalsete arvutuste kasutamine selleks viib korrelatsioonikoefitsientide (ühenduvuse mõõdikute) kehtestamiseni.
Selliseid arvutusi nimetatakse korrelatsioonianalüüs. Seda tehakse selleks, et kinnitada 2 muutuja (juhuslikud muutujad) sõltuvust üksteisest, mida väljendatakse korrelatsioonikordaja abil.
Korrelatsioonimeetodi kasutamine võimaldab meil lahendada mitmeid probleeme:
- tuvastada analüüsitavate parameetrite vaheline seos;
- teadmine korrelatsiooni olemasolust võimaldab lahendada prognoosiprobleeme. Seega on reaalne võimalus ennustada parameetri käitumist teise korrelatsiooniparameetri käitumise analüüsi põhjal;
- klassifitseerimine, mis põhineb üksteisest sõltumatute tunnuste valikul.
Muutujate jaoks:
- järgu skaalaga seoses arvutatakse Spearmani koefitsient;
- seotud intervallskaalaga – Pearsoni koefitsient.
Need on kõige sagedamini kasutatavad parameetrid, kuid on ka teisi.
Koefitsiendi väärtust saab väljendada nii positiivselt kui ka negatiivselt.
Esimesel juhul, kui ühe muutuja väärtus suureneb, täheldatakse teise muutuja suurenemist. Negatiivse koefitsiendiga on muster vastupidine.
Mille jaoks on korrelatsioonikordaja?
Üksteisega seotud juhuslikud muutujad võivad omada selle seose täiesti erinevat olemust. See ei pruugi olla funktsionaalne, juhul kui koguste vahel on otsene seos. Kõige sagedamini mõjutab mõlemat suurust terve hulk erinevaid tegureid, juhtudel, kui need on mõlemale suurusele ühised, täheldatakse seotud mustrite teket.
See tähendab, et kogustevahelise seose olemasolu statistiliselt tõestatud fakt ei ole kinnitus, et täheldatud muutuste põhjus on tuvastatud. Reeglina järeldab uurija, et on kaks omavahel seotud tagajärge.
Korrelatsioonikordaja omadused
Sellel statistikal on järgmised omadused:
- koefitsiendi väärtus on vahemikus -1 kuni +1. Mida lähemal äärmuslikele väärtustele, seda tugevam on lineaarsete parameetrite positiivne või negatiivne seos. Nullväärtuse puhul räägime tunnustevahelise korrelatsiooni puudumisest;
- koefitsiendi positiivne väärtus näitab, et ühe tunnuse väärtuse suurenemise korral täheldatakse teise tõusu (positiivne korrelatsioon);
- negatiivne väärtus - ühe atribuudi väärtuse suurenemise korral täheldatakse teise vähenemist (negatiivne korrelatsioon);
- indikaatori väärtuse lähenemine äärmuslikele punktidele (kas -1 või +1) näitab väga tugeva lineaarse seose olemasolu;
- tunnusnäitajad võivad muutuda koefitsiendi konstantse väärtusega;
- korrelatsioonikordaja on mõõtmeteta suurus;
- korrelatsiooni olemasolu ei ole põhjusliku seose kohustuslik kinnitus.
Korrelatsioonikordaja väärtused
Korrelatsiooni tugevust saab iseloomustada Cheldoki skaala kasutamisega, kus kvalitatiivne tunnus vastab teatud arvväärtusele.
Positiivse korrelatsiooni korral väärtuses:
- 0-0,3 - korrelatsioon on väga nõrk;
- 0,3-0,5 - nõrk;
- 0,5-0,7 - keskmine tugevus;
- 0,7-0,9 - kõrge;
- 0,9-1 - väga kõrge korrelatsiooni tugevus.
Skaalat saab kasutada ka negatiivse korrelatsiooni jaoks. Sel juhul asendatakse kvalitatiivsed omadused vastandlikega.
Võite kasutada lihtsustatud Cheldoki skaalat, milles eristatakse ainult 3 korrelatsiooni tugevuse gradatsiooni:
- väga tugev - näitajad ± 0,7 - ± 1;
- keskmine - näitajad ± 0,3 - ± 0,699;
- väga nõrk - näitajad 0 - ± 0,299.
See statistiline näitaja võimaldab mitte ainult testida tunnuste vahelise lineaarse seose olemasolu, vaid ka määrata selle tugevust.
Korrelatsioonikordaja tüübid
Korrelatsioonikordajaid saab klassifitseerida märgi ja väärtuse järgi:
- positiivne;
- null;
- negatiivne.
Sõltuvalt analüüsitud väärtustest arvutatakse koefitsient:
- Pearson;
- Spearman;
- Kendala;
- Fechneri märgid;
- kooskõla või mitmeastmeline korrelatsioon.
Pearsoni korrelatsioonikoefitsienti kasutatakse muutujate absoluutväärtuste vaheliste otseste seoste loomiseks. Sel juhul peaksid mõlema muutujate seeria jaotused lähenema normaalväärtustele. Võrreldavad muutujad peaksid erinema sama arvu erinevate tunnuste poolest. Muutujaid esindav skaala peab olema kas intervallskaala või suhteskaala.
- korrelatsiooni tugevuse täpne määramine;
- kvantitatiivsete tunnuste võrdlus.
Pearsoni lineaarse korrelatsioonikordaja kasutamisel on vähe puudusi:
- meetod on ebastabiilne arvväärtuste kõrvalekallete korral;
- seda meetodit kasutades on võimalik määrata korrelatsiooni tugevust ainult lineaarse seose korral, muud tüüpi muutujate omavaheliste seoste puhul tuleks kasutada regressioonanalüüsi meetodeid.
Astekorrelatsioon määratakse Spearmani meetodiga, mis võimaldab statistiliselt uurida nähtuste vahelisi seoseid. Tänu sellele koefitsiendile arvutatakse kahe kvantitatiivselt väljendatud tunnuste jada tegelik paralleelsusaste ja hinnatakse ka tuvastatud seose lähedust.
- ei nõua korrelatsiooni tugevuse väärtuse täpset määratlust;
- võrreldavatel näitajatel on nii kvantitatiivsed kui ka omistatavad väärtused;
- tunnusridade võrdlemine avatud väärtusvariantidega.
Spearmani meetod viitab mitteparameetrilistele analüüsimeetoditele, mistõttu tunnuste jaotuse normaalsust pole vaja kontrollida. Lisaks võimaldab see võrrelda erinevates skaalades väljendatud näitajaid. Näiteks punaste vereliblede arvu väärtuste võrdlemine teatud veremahus (pidev skaala) ja eksperdihinnang, väljendatuna punktides (järjekorraskaal).
Meetodi tõhusust mõjutab negatiivselt suur erinevus võrreldavate väärtuste väärtuste vahel. Meetod on ebaefektiivne ka juhtudel, kui mõõdetud väärtust iseloomustab väärtuste ebaühtlane jaotus.
Korrelatsioonikordaja samm-sammult arvutamine Excelis
Korrelatsioonikordaja arvutamine hõlmab mitmete matemaatiliste tehtete järjestikust täitmist.
Ülaltoodud valem Pearsoni koefitsiendi arvutamiseks näitab, kui töömahukas on see protsess käsitsi tehes.
Excelli võimaluste kasutamine kiirendab kohati koefitsiendi leidmise protsessi.
Piisab, kui järgida lihtsat toimingute algoritmi:
- põhiteabe tutvustus - x väärtuste veerg ja y väärtuste veerg;
- tööriistades valitakse ja avatakse vahekaart Valemid;
- avaneval vahekaardil valige "Sisesta fx-funktsioon";
- avanevas dialoogiaknas on valitud statistiline funktsioon "Korrel", mis võimaldab arvutada korrelatsioonikordaja 2 andmemassiivi vahel;
- avanevas aknas sisestatakse andmed: massiiv 1 - veeru x väärtuste vahemik (andmed tuleb valida), massiiv 2 - y veeru väärtuste vahemik;
- vajutatakse klahvi "OK", koefitsiendi arvutamise tulemus kuvatakse reale "value";
- järeldus kahe andmekogumi ja selle tugevuse vahelise korrelatsiooni olemasolu kohta.
Korrelatsioonimudel (CM) on arvutusprogramm, mis annab matemaatilise võrrandi, milles saadud näitaja kvantifitseeritakse sõltuvalt ühest või mitmest näitajast.
yx \u003d ao + a1x1
kus: y - tulemusnäitaja, olenevalt tegurist x;
x - teguri märk;
a1 - parameeter KM, mis näitab, kui palju muutub efektiivne näitaja y, kui tegur x muutub ühe võrra, kui samal ajal jäävad kõik muud y-d mõjutavad tegurid muutumatuks;
ao - parameeter KM, mis näitab kõigi teiste tegurite mõju efektiivsele indikaatorile y, välja arvatud faktori märk x
Mudeli efekti- ja faktornäitajate valikul tuleb arvestada asjaoluga, et efektiivnäitaja põhjus-tagajärg seoste ahelas on faktorinäitajatest kõrgemal tasemel.
Korrelatsioonimudeli tunnused
Peale korrelatsioonimudeli parameetrite arvutamist arvutatakse välja korrelatsioonikordaja.
p - paari korrelatsioonikordaja, -1 ≤ p ≤ 1, näitab tegurinäitaja mõju tugevust ja suunda efektiivsele. Mida lähemal 1-le, seda tugevam on suhe, mida lähemal 0-le, seda nõrgem on suhe. Kui korrelatsioonikordaja on positiivne, on seos otsene, kui negatiivne, siis pöördvõrdeline.
Korrelatsioonikordaja valem: pxy \u003d (xy-x * 1 / y) / eh * ey
ex=xx2-(x)2; eu=y2-(y)2
Kui CM on lineaarne mitmefaktoriline, on vorm:
yx \u003d ao + a1x1 + a2x2 + ... + axp
siis arvutatakse sellele mitmekordne korrelatsioonikordaja.
0 ≤ Р ≤ 1 ja näitab kõigi faktorinäitajate mõju tugevust efektiivsele.
P \u003d 1- ((uh-uy) 2 / (yi - usr) 2)
Kus: uh - efektiivne näitaja - arvutatud väärtus;
ui – tegelik väärtus;
usr - tegelik väärtus, keskmine.
Arvutatud väärtus yx saadakse korrelatsioonimudeliga asendamise tulemusena x1, x2 jne asemel. nende tegelikud väärtused.
Ühe- ja mitmefaktoriliste mittelineaarsete mudelite puhul arvutatakse korrelatsioonisuhe:
1 ≤ m ≤ 1;
Arvatakse, et mudelis sisalduvate efekti- ja faktorinäitajate vaheline seos on nõrk, kui seose tiheduse koefitsiendi (m) väärtus jääb vahemikku 0-0,3; kui 0,3-0,7 - ühenduse tihedus on keskmine; üle 0,7-1 - ühendus on tugev.
Kuna korrelatsioonikordaja (paaris) p, korrelatsioonikordaja (mitmekordne) P, korrelatsioonisuhe m on tõenäosusväärtused, siis nende jaoks arvutatakse nende olulisuse koefitsiendid (määratakse tabelitest). Kui need koefitsiendid on suuremad kui nende tabeliväärtus, on seose tiheduse koefitsiendid olulised põhjused. Kui ühenduse tiheduse olulisuse koefitsiendid on väiksemad kui tabeliväärtused või kui ühenduse koefitsient ise on väiksem kui 0,7, siis ei ole mudelisse kaasatud kõik tulemust oluliselt mõjutavad tegurinäitajad.
Determinatsioonikoefitsient näitab selgelt mudelis sisalduvate tegurinäitajate protsenti, mis määravad tulemuse kujunemise.
Kui määramiskoefitsient on suurem kui 50, siis kirjeldab mudel uuritavat protsessi adekvaatselt, kui see on alla 50, siis on vaja naasta ehituse esimesse etappi ja üle vaadata tegurinäitajate valik, et neid lisada. mudel.
Fisheri koefitsient ehk Fisheri kriteerium iseloomustab mudeli kui terviku efektiivsust. Kui koefitsiendi arvutuslik väärtus ületab tabeli väärtust, siis sobib konstrueeritud mudel analüüsiks, samuti indikaatorite planeerimiseks, arvutusteks tuleviku jaoks. Tabeli ligikaudne väärtus \u003d 1,5. Kui arvutuslik väärtus on väiksem kui tabeli väärtus, tuleb esmalt üles ehitada mudel, kaasa arvatud tegurid, mis tulemust oluliselt mõjutavad. Lisaks mudeli kui terviku efektiivsusele mõjutab iga regressioonikordaja olulisust. Kui selle koefitsiendi arvutatud väärtus ületas tabeli väärtust, on regressioonikoefitsient oluline, kui see on väiksem, siis eemaldatakse valimist tegurinäitaja, mille jaoks see koefitsient arvutatakse, arvutused algavad otsast, kuid ilma selle tegurita .
Korrelatsioonikordaja on kahe muutuja vahelise seose määr. Selle arvutus annab aimu, kas kahe andmekogumi vahel on seos. Erinevalt regressioonist ei võimalda korrelatsioon väärtusi ennustada. Koefitsiendi arvutamine on aga oluline samm esialgses statistilises analüüsis. Näiteks leidsime, et korrelatsioonikordaja välismaiste otseinvesteeringute taseme ja SKP kasvu vahel on kõrge. See annab aimu, et heaolu tagamiseks on vaja luua soodne kliima just välismaistele ettevõtjatele. Ei ole esmapilgul nii ilmne järeldus!
Korrelatsioon ja põhjuslik seos
Võib-olla pole ühtegi statistikavaldkonda, mis oleks meie elus nii kindlalt kinnistunud. Korrelatsioonikordajat kasutatakse kõigis avalike teadmiste valdkondades. Selle peamine oht seisneb selles, et sageli spekuleeritakse selle kõrgete väärtustega, et inimesi veenda ja teatud järeldustesse uskuma panna. Kuid tegelikult ei näita tugev korrelatsioon sugugi põhjuslikku seost koguste vahel.
Korrelatsioonikordaja: Pearsoni ja Spearmani valem
Kahe muutuja vahelist seost iseloomustavad mitmed põhinäitajad. Ajalooliselt on esimene Pearsoni lineaarne korrelatsioonikordaja. See antakse koolis läbi. Selle töötasid välja K. Pearson ja J. Yule Fr. Galton. See koefitsient võimaldab näha seost ratsionaalselt muutuvate ratsionaalsete arvude vahel. See on alati suurem kui -1 ja väiksem kui 1. Negatiivne arv näitab pöördvõrdelist seost. Kui koefitsient on null, siis muutujate vahel seost ei ole. Võrdne positiivse arvuga – uuritavate suuruste vahel on otseselt võrdeline seos. Spearmani auaste korrelatsioonikordaja võimaldab arvutusi lihtsustada muutujate väärtuste hierarhia konstrueerimisega.
Muutujate vahelised seosed
Korrelatsioon aitab vastata kahele küsimusele. Esiteks, kas muutujate vaheline seos on positiivne või negatiivne. Teiseks, kui tugev on sõltuvus. Korrelatsioonianalüüs on võimas tööriist selle olulise teabe hankimiseks. On lihtne näha, et leibkondade sissetulekud ja kulud kasvavad ja vähenevad proportsionaalselt. Sellist suhet peetakse positiivseks. Vastupidi, kui toote hind tõuseb, siis nõudlus selle järele langeb. Sellist suhet nimetatakse negatiivseks. Korrelatsioonikordaja väärtused on vahemikus -1 kuni 1. Null tähendab, et uuritud väärtuste vahel puudub seos. Mida lähemal on näitaja äärmuslikele väärtustele, seda tugevam on seos (negatiivne või positiivne). Sõltuvuse puudumist tõendab koefitsient -0,1 kuni 0,1. Tuleb mõista, et selline väärtus näitab ainult lineaarse seose puudumist.
Rakenduse funktsioonid
Mõlema näitaja kasutamine sõltub teatud eeldustest. Esiteks ei määra tugeva suhte olemasolu seda, et üks väärtus määrab teise. Võib olla ka kolmas suurus, mis määrab igaüks neist. Teiseks ei näita kõrge Pearsoni korrelatsioonikordaja põhjuslikku seost uuritud muutujate vahel. Kolmandaks näitab see eranditult lineaarset seost. Korrelatsiooni saab kasutada tähenduslike kvantitatiivsete andmete (nt õhurõhk, õhutemperatuur) hindamiseks, mitte kategooriate, nagu sugu või lemmikvärv, hindamiseks.
Mitmekordne korrelatsioonikordaja
Pearson ja Spearman uurisid kahe muutuja vahelist seost. Aga mis teha, kui neid on kolm või isegi rohkem. Siin tulebki sisse mitmekordne korrelatsioonikordaja. Näiteks ei mõjuta rahvamajanduse koguprodukti mitte ainult välismaised otseinvesteeringud, vaid ka riigi raha- ja fiskaalpoliitika ning ekspordi tase. SKP kasvutempo ja maht on mitmete tegurite koosmõju tulemus. Siiski tuleb mõista, et mitme korrelatsiooni mudel põhineb paljudel lihtsustustel ja eeldustel. Esiteks on välistatud suuruste vaheline multikollineaarsus. Teiseks eeldatakse, et sõltuva muutuja ja seda mõjutavate muutujate vaheline seos on lineaarne.
Korrelatsioon- ja regressioonanalüüsi kasutusvaldkonnad
Seda suuruste vaheliste seoste leidmise meetodit kasutatakse statistikas laialdaselt. Kõige sagedamini kasutatakse seda kolmel põhijuhul:
- Kahe muutuja väärtuste vaheliste põhjuslike seoste testimiseks. Selle tulemusena loodab teadlane leida lineaarse seose ja tuletada valemi, mis kirjeldab neid seoseid suuruste vahel. Nende mõõtühikud võivad olla erinevad.
- Väärtustevahelise seose kontrollimiseks. Sel juhul ei määra keegi, milline muutuja on sõltuv. Võib selguda, et mõlema suuruse väärtus määrab mõne muu teguri.
- Võrrandi tuletamiseks. Sel juhul saate sellesse lihtsalt numbrid asendada ja tundmatu muutuja väärtused teada saada.
Mees, kes otsib põhjuslikku seost
Teadvus on paigutatud nii, et me kindlasti peame selgitama ümber toimuvaid sündmusi. Inimene otsib alati seost maailmapildi, milles ta elab, ja saadava informatsiooni vahel. Sageli loob aju korra kaosest. Ta võib kergesti näha põhjuslikku seost seal, kus seda pole. Teadlased peavad konkreetselt õppima sellest suundumusest üle saama. Oskus hinnata andmete vahelisi seoseid on akadeemilises karjääris objektiivselt oluline.
Meedia eelarvamus
Mõelge, kuidas saab korrelatsiooni olemasolu valesti tõlgendada. Rühmalt halvasti käitunud Briti õpilasi küsiti, kas nende vanemad suitsetavad. Siis avaldati test ajalehes. Tulemus näitas tugevat seost vanemate suitsetamise ja nende laste kuritegevuse vahel. Selle uuringu läbi viinud professor soovitas isegi sigaretipakkidele selle kohta hoiatuse panna. Selle järeldusega on aga mitmeid probleeme. Esiteks ei näita korrelatsioon, milline suurustest on sõltumatu. Seetõttu on täiesti võimalik eeldada, et vanemate hukatusliku harjumuse põhjuseks on laste sõnakuulmatus. Teiseks ei saa kindlalt väita, et mõlemad probleemid ei tekkinud mõne kolmanda teguri tõttu. Näiteks madala sissetulekuga pered. Märkida tuleb uuringu läbiviija professori esialgsete järelduste emotsionaalset aspekti. Ta oli tulihingeline suitsetamise vastane. Seetõttu pole üllatav, et ta oma uuringu tulemusi nii tõlgendas.
järeldused
Korrelatsiooni valesti tõlgendamine kahe muutuja vahelise põhjusliku seosena võib viia piinlike uurimisvigadeni. Probleem on selles, et see asub inimteadvuse tuumas. Paljud turundusnipid põhinevad sellel funktsioonil. Põhjusliku seose ja korrelatsiooni erinevuse mõistmine võimaldab teil teavet ratsionaalselt analüüsida nii igapäevaelus kui ka tööalases karjääris.