Kas yra koreliacija statistikoje. Koreliacijos koeficientas yra koreliacijos modelio charakteristika. Kaip interpretuoti Pirsono koreliacijos koeficiento reikšmę
![Kas yra koreliacija statistikoje. Koreliacijos koeficientas yra koreliacijos modelio charakteristika. Kaip interpretuoti Pirsono koreliacijos koeficiento reikšmę](https://i2.wp.com/psyfactor.org/lib/i/Image45.gif)
» Statistika
Statistika ir duomenų apdorojimas psichologijoje
(tęsinys)
Koreliacinė analizė
Studijuojant koreliacijos pabandykite nustatyti, ar yra koks nors ryšys tarp dviejų tos pačios imties rodiklių (pavyzdžiui, tarp vaikų ūgio ir svorio arba tarp lygio IQ ir mokyklos rezultatai) arba tarp dviejų skirtingų imčių (pavyzdžiui, lyginant dvynių poras), ir jei toks ryšys egzistuoja, ar vieno rodiklio padidėjimą lydi rodiklio padidėjimas (teigiama koreliacija), ar sumažėjimas (neigiama koreliacija). kitas.
Kitaip tariant, koreliacinė analizė padeda nustatyti, ar galima numatyti galimas vieno rodiklio reikšmes, žinant kito reikšmę.
Iki šiol analizuodami savo patirtį tiriant marihuanos poveikį, sąmoningai ignoravome tokį rodiklį kaip reakcijos laikas. Tuo tarpu būtų įdomu patikrinti, ar yra ryšys tarp reakcijų efektyvumo ir jų greičio. Tai leistų, pavyzdžiui, teigti, kad kuo žmogus lėtesnis, tuo tikslesni ir efektyvesni bus jo veiksmai ir atvirkščiai.
Tam tikslui gali būti naudojami du skirtingi metodai: parametrinis Bravais-Pearson koeficiento (r) skaičiavimas ir Spearmano rango koreliacijos koeficiento (r s) skaičiavimas, kuris taikomas eiliniams duomenims, t.y. yra neparametrinis. Tačiau pirmiausia išsiaiškinkime, kas yra koreliacijos koeficientas.
Koreliacijos koeficientas
Koreliacijos koeficientas yra vertė, kuri gali svyruoti nuo +1 iki -1. Esant visiškai teigiamai koreliacijai, šis koeficientas yra lygus plius 1, o visiškos neigiamos koreliacijos atveju - minus 1. Grafike tai atitinka tiesę, einančią per koreliacijos susikirtimo taškus. kiekvienos duomenų poros vertės:
Jei šie taškai išsidėsto ne tiesia linija, o sudaro „debesį“, koreliacijos koeficiento absoliuti reikšmė tampa mažesnė už vienetą ir artėja prie nulio debesiui suapvalinus:
Jei koreliacijos koeficientas yra 0, abu kintamieji yra visiškai nepriklausomi vienas nuo kito.
Humanitariniuose moksluose koreliacija laikoma stipria, jei jos koeficientas didesnis nei 0,60; jei jis viršija 0,90, tai koreliacija laikoma labai stipri. Tačiau tam, kad būtų galima padaryti išvadas apie ryšius tarp kintamųjų, didelę reikšmę turi imties dydis: kuo didesnė imtis, tuo patikimesnė gauto koreliacijos koeficiento reikšmė. Yra lentelių su kritinėmis Bravais-Pearson ir Spearman koreliacijos koeficientų reikšmėmis skirtingam laisvės laipsnių skaičiui (tai lygu porų skaičiui atėmus 2, t.y. n- 2). Tik jei koreliacijos koeficientai yra didesni už šias kritines vertes, jie gali būti laikomi patikimais. Taigi, kad koreliacijos koeficientas 0,70 būtų patikimas, į analizę reikia atsižvelgti bent 8 duomenų poras. ( h =n-2=6) skaičiuojant r (žr. 4 lentelę priede) ir 7 duomenų poras (h = n-2= 5) skaičiuojant r s (priedo 5 lentelė).
Dar kartą noriu pabrėžti, kad šių dviejų koeficientų esmė kiek skiriasi. Neigiamas koeficientas r rodo, kad efektyvumas dažniausiai būna didesnis, tuo greitesnis reakcijos laikas, tuo tarpu skaičiuojant koeficientą r s reikėjo pasitikrinti, ar greitesni tiriamieji visada reaguoja tiksliau, o lėtesni – ne taip tiksliai.
Bravais-Pearson koreliacijos koeficientas (r) - Tai parametrinis rodiklis, kurio skaičiavimui lyginamas dviejų matavimų rezultatų vidutinis ir standartinis nuokrypis. Šiuo atveju naudojama formulė (skirtingiems autoriams ji gali atrodyti skirtingai)
kur Σ XY- kiekvienos poros duomenų sandaugų suma;
n yra porų skaičius;
X – duoto kintamojo vidurkis x;
Y -
kintamų duomenų vidurkis Y
Sx- pasiskirstymo standartinis nuokrypis X;
Sy- pasiskirstymo standartinis nuokrypis adresu
Spearman rango koreliacijos koeficientas ( rs ) - tai neparametrinis rodiklis, kurio pagalba bandoma atskleisti ryšį tarp atitinkamų dydžių eilių dviejose matavimų serijose.
Šį koeficientą lengviau apskaičiuoti, tačiau rezultatai yra mažiau tikslūs nei naudojant r. Taip yra dėl to, kad skaičiuojant Spearmano koeficientą, naudojama duomenų tvarka, o ne jų kiekybinės charakteristikos ir intervalai tarp klasių.
Faktas yra tai, kad naudojant Spearman rangų koreliacijos koeficientą (r s), jie tik patikrina, ar bet kurios imties duomenų reitingas bus toks pat kaip ir kitų šios imties duomenų, poromis susijusių su pirmuoju (pvz. , ar jie bus vienodi „reitinguoti“ tiek psichologijos, tiek matematikos studentų, ar net su dviem skirtingais psichologijos mokytojais?). Jei koeficientas yra artimas +1, tai reiškia, kad abi serijos praktiškai sutampa, o jei šis koeficientas yra artimas -1, galime kalbėti apie visišką atvirkštinį ryšį.
Koeficientas rs apskaičiuojamas pagal formulę
kur d yra skirtumas tarp konjuguotų požymių verčių eilučių (nepriklausomai nuo jo ženklo) ir porų skaičius.
Paprastai šis neparametrinis testas naudojamas tais atvejais, kai reikia padaryti kai kurias išvadas ne tiek apie intervalais tarp duomenų, kiek apie juos gretas, taip pat kai pasiskirstymo kreivės yra per daug iškreiptos ir neleidžia naudoti parametrinių kriterijų, tokių kaip koeficientas r (šiais atvejais gali prireikti kiekybinius duomenis paversti eiliniais).
Santrauka
Taigi, mes išnagrinėjome įvairius parametrinius ir neparametrinius statistikos metodus, naudojamus psichologijoje. Mūsų apžvalga buvo labai paviršutiniška, o jos pagrindinė užduotis buvo priversti skaitytoją suprasti, kad statistika nėra tokia baisi, kaip atrodo, o dažniausiai reikalauja sveiko proto. Primename, kad „patirties“ duomenys, su kuriais čia nagrinėjome, yra fiktyvūs ir negali būti pagrindas jokioms išvadoms. Tačiau tokį eksperimentą būtų verta atlikti. Kadangi šiam eksperimentui buvo pasirinkta grynai klasikinė technika, tą pačią statistinę analizę galima naudoti daugelyje skirtingų eksperimentų. Bet kuriuo atveju mums atrodo, kad nubrėžėme keletą pagrindinių krypčių, kurios gali būti naudingos tiems, kurie nežino, nuo ko pradėti statistinę rezultatų analizę.
Literatūra
- Godefroy J. Kas yra psichologija. - M., 1992 m.
- Chatillon G., 1977. Statistique en Sciences humaines, Trois-Rivieres, Red. SMG.
- Gilbertas N. 1978. Statistiques, Monrealis, Red. H.R.W.
- Moroney M.J., 1970. Comprendre la statistique, Verviers, Gerard et Cie.
- Siegel S., 1956. Neparametrinė statistika, Niujorkas, MacGraw-Hill Book Co.
Skaičiuoklės programa
Pastabos. 1) Dėl didelių imčių arba mažesnių nei 0,05 reikšmingumo lygių žr. lenteles statistikos vadovėliuose.
2) Kitų neparametrinių kriterijų verčių lenteles galite rasti specialiose gairėse (žr. bibliografiją).
1 lentelė. Kriterijų reikšmės t Studentas | |
h | 0,05 |
1 | 6,31 |
2 | 2,92 |
3 | 2,35 |
4 | 2,13 |
5 | 2,02 |
6 | 1,94 |
7 | 1,90 |
8 | 1,86 |
9 | 1,83 |
10 | 1,81 |
11 | 1,80 |
12 | 1,78 |
13 | 1,77 |
14 | 1,76 |
15 | 1,75 |
16 | 1,75 |
17 | 1,74 |
18 | 1,73 |
19 | 1,73 |
20 | 1,73 |
21 | 1,72 |
22 | 1,72 |
23 | 1,71 |
24 | 1,71 |
25 | 1,71 |
26 | 1,71 |
27 | 1,70 |
28 | 1,70 |
29 | 1,70 |
30 | 1,70 |
40 | 1,68 |
¥ | 1,65 |
2 lentelė. Kriterijaus χ 2 reikšmės | |
h | 0,05 |
1 | 3,84 |
2 | 5,99 |
3 | 7,81 |
4 | 9,49 |
5 | 11,1 |
6 | 12,6 |
7 | 14,1 |
8 | 15,5 |
9 | 16,9 |
10 | 18,3 |
3 lentelė. Patikimos Z reikšmės | |
R | Z |
0,05 | 1,64 |
0,01 | 2,33 |
4 lentelė. Patikimos (kritinės) r reikšmės | ||
h = (N-2) | p= 0,05 (5%) | |
3 | 0,88 | |
4 | 0,81 | |
5 | 0,75 | |
6 | 0,71 | |
7 | 0,67 | |
8 | 0,63 | |
9 | 0,60 | |
10 | 0,58 | |
11 | 0.55 | |
12 | 0,53 | |
13 | 0,51 | |
14 | 0,50 | |
15 | 0,48 | |
16 | 0,47 | |
17 | 0,46 | |
18 | 0,44 | |
19 | 0,43 | |
20 | 0,42 |
5 lentelė. Patikimos (kritinės) r s reikšmės | |
h = (N-2) | p = 0,05 |
2 | 1,000 |
3 | 0,900 |
4 | 0,829 |
5 | 0,714 |
6 | 0,643 |
7 | 0,600 |
8 | 0,564 |
10 | 0,506 |
12 | 0,456 |
14 | 0,425 |
16 | 0,399 |
18 | 0,377 |
20 | 0,359 |
22 | 0,343 |
24 | 0,329 |
26 | 0,317 |
28 | 0,306 |
Koreliacijos koeficientas yra reikšmė, kuri gali svyruoti nuo +1 iki -1. Esant visiškai teigiamai koreliacijai, šis koeficientas lygus plius 1 (jie sako, kad padidėjus vieno kintamojo vertei, kito kintamojo reikšmė didėja), o esant visiškai neigiamai koreliacijai - minus 1 (nurodykite grįžtamąjį ryšį t.y. kai vieno kintamojo reikšmės didėja, kito vertės mažėja).
1 pavyzdys:
Drovumo ir depresijos priklausomybės grafikas. Kaip matote, taškai (subjektai) išsidėstę ne atsitiktinai, o išsirikiuoja aplink vieną eilutę, ir, pažvelgus į šią liniją, galime teigti, kad kuo didesnis drovumas išreiškiamas žmoguje, tuo labiau depresyvūs, t.y. šie reiškiniai. yra tarpusavyje susiję.
2 pavyzdys: drovumo ir bendravimo grafikas. Matome, kad didėjant drovumui, bendrumas mažėja. Jų koreliacijos koeficientas –0,43. Taigi koreliacijos koeficientas, didesnis nuo 0 iki 1, rodo tiesiogiai proporcingą ryšį (kuo daugiau ... tuo daugiau ...), o koeficientas nuo -1 iki 0 rodo atvirkščiai proporcingą ryšį (kuo daugiau ... tuo mažiau . ..)
Jei koreliacijos koeficientas yra 0, abu kintamieji yra visiškai nepriklausomi vienas nuo kito.
koreliacija- tai ryšys, kai atskirų veiksnių įtaka pasireiškia tik kaip tendencija (vidutiniškai) su masiniu faktinių duomenų stebėjimu. Koreliacinės priklausomybės pavyzdžiais gali būti priklausomybė tarp banko turto dydžio ir banko pelno dydžio, darbo našumo augimo ir darbuotojų darbo stažo.
Naudojamos dvi koreliacijų klasifikavimo pagal jų stiprumą sistemos: bendroji ir specialioji.
Bendra koreliacijų klasifikacija: 1) stipri arba artima, kurios koreliacijos koeficientas r> 0,70; 2) vidutinis 0,500,70, o ne tik didelio reikšmingumo koreliacija.Toliau pateiktoje lentelėje pateikiami skirtingų tipų svarstyklių koreliacijos koeficientų pavadinimai.
Dichotominė skalė (1/0) | Rango (eilės) skalė | ||
Dichotominė skalė (1/0) | Pirsono asociacijos koeficientas, Pirsono keturių ląstelių konjugacijos koeficientas. | Biserinė koreliacija | |
Rango (eilės) skalė | Rango-biserinė koreliacija. | Spearmano arba Kendall rango koreliacijos koeficientas. | |
Intervalas ir absoliuti skalė | Biserinė koreliacija | Intervalų skalės reikšmės konvertuojamos į rangus ir naudojamas rango koeficientas | Pirsono koreliacijos koeficientas (tiesinės koreliacijos koeficientas) |
At r=0 tiesinės koreliacijos nėra. Šiuo atveju kintamųjų grupiniai vidurkiai sutampa su jų bendraisiais vidurkiais, o regresijos tiesės lygiagrečios koordinačių ašims.
Lygybė r=0 kalba tik apie tiesinės koreliacijos priklausomybės nebuvimą (nekoreliuojamus kintamuosius), bet ne apskritai apie koreliacijos nebuvimą, o juo labiau apie statistinę priklausomybę.
Kartais išvada, kad koreliacijos nėra, yra svarbesnė už stiprios koreliacijos buvimą. Nulinė dviejų kintamųjų koreliacija gali reikšti, kad vienas kintamasis neturi įtakos kitam, su sąlyga, kad pasitikime matavimų rezultatais.
SPSS: 11.3.2 Koreliacijos koeficientai
Iki šiol mes išsiaiškinome tik patį statistinio ryšio tarp dviejų požymių egzistavimą. Toliau pabandysime išsiaiškinti, kokias išvadas galima padaryti apie šios priklausomybės stiprumą ar silpnumą, taip pat apie jos formą ir kryptį. Kriterijai, skirti kiekybiškai įvertinti ryšį tarp kintamųjų, vadinami koreliacijos koeficientais arba jungiamumo matais. Du kintamieji yra teigiamai koreliuojami, jei tarp jų yra tiesioginis, vienakryptis ryšys. Esant vienakrypčiui ryšiui, mažos vieno kintamojo reikšmės atitinka mažas kito kintamojo reikšmes, didelės – dideles. Du kintamieji yra neigiamai koreliuojami, jei tarp jų yra atvirkštinis ryšys. Esant daugiakrypčiui ryšiui, mažos vieno kintamojo reikšmės atitinka dideles kito kintamojo reikšmes ir atvirkščiai. Koreliacijos koeficientų reikšmės visada yra nuo -1 iki +1.
Spearmano koeficientas naudojamas kaip koreliacijos koeficientas tarp eilės skalei priklausančių kintamųjų, o Pirsono koreliacijos koeficientas (produktų momentas) – intervalų skalei priklausantiems kintamiesiems. Šiuo atveju reikia pažymėti, kad kiekvienas dichotominis kintamasis, tai yra kintamasis, priklausantis vardinei skalei ir turintis dvi kategorijas, gali būti laikomas eiliniu.
Pirmiausia patikrinsime, ar yra ryšys tarp lyties ir psichikos kintamųjų iš studium.sav failo. Tai darydami atsižvelgiame į tai, kad dichotominė kintamoji lytis gali būti laikoma eilės kintamuoju. Atlikite šiuos veiksmus:
Komandų meniu pasirinkite Analizuoti (Analizė) Aprašomoji statistika (Aprašomoji statistika) Kryžminiai taškai... (Nenumatytų atvejų lentelės)
· Perkelkite kintamąjį lytį į eilučių sąrašą, o kintamąjį psichiką – į stulpelių sąrašą.
· Spustelėkite mygtuką Statistika.... Dialogo lange Crosstabs: Statistics pažymėkite langelį Koreliacijos. Patvirtinkite savo pasirinkimą mygtuku Tęsti.
· Dialogo lange Crosstabs nustokite rodyti lenteles pažymėdami žymimąjį langelį Supress tables. Spustelėkite mygtuką Gerai.
Bus apskaičiuojami Spearmano ir Pearsono koreliacijos koeficientai ir patikrintas jų reikšmingumas:
/ SPSS 10
10 užduotis Koreliacinė analizė
Koreliacijos samprata
Koreliacija arba koreliacijos koeficientas yra statistinis rodiklis tikimybinis ryšiai tarp dviejų kintamųjų, išmatuotų kiekybinėmis skalėmis. Priešingai nei funkcinis ryšys, kuriame kiekviena vieno kintamojo reikšmė atitinka griežtai apibrėžta kito kintamojo reikšmė, tikimybinis ryšys pasižymi tuo, kad kiekviena vieno kintamojo reikšmė atitinka vertybių rinkinys Kitas kintamasis, Tikimybinio ryšio pavyzdys yra žmonių ūgio ir svorio santykis. Akivaizdu, kad skirtingo svorio žmonės gali turėti vienodą ūgį ir atvirkščiai.
Koreliacija yra reikšmė nuo -1 iki + 1 ir žymima raide r. Be to, jei vertė yra arčiau 1, tai reiškia, kad yra stiprus ryšys, o jei jis yra arčiau 0, tada silpnas. Koreliacijos reikšmė mažesnė nei 0,2 laikoma silpna koreliacija, didesnė nei 0,5 – aukšta. Jei koreliacijos koeficientas yra neigiamas, tai reiškia, kad yra atvirkštinis ryšys: kuo didesnė vieno kintamojo reikšmė, tuo mažesnė kito.
Atsižvelgiant į priimtas koeficiento r vertes, galima išskirti skirtingus koreliacijos tipus:
Stipri teigiama koreliacija nustatoma pagal reikšmę r=1. Terminas „griežtas“ reiškia, kad vieno kintamojo reikšmę vienareikšmiškai lemia kito kintamojo reikšmės, o terminas „ teigiamas" - kad didėjant vieno kintamojo reikšmei didėja ir kito kintamojo reikšmė.
Griežta koreliacija yra matematinė abstrakcija ir beveik niekada nepasitaiko tikruose tyrimuose.
teigiama koreliacija atitinka reikšmes 0
Koreliacijos trūkumas nustatoma pagal reikšmę r=0. Nulinis koreliacijos koeficientas rodo, kad kintamųjų reikšmės niekaip nesusijusios viena su kita.
Koreliacijos trūkumas H o : 0 r xy =0 suformuluotas kaip atspindys nulinis hipotezės koreliacinėje analizėje.
neigiama koreliacija: -1
Stipri neigiama koreliacija nustatoma pagal reikšmę r= -1. Ji, kaip ir griežta teigiama koreliacija, yra abstrakcija ir praktiniuose tyrimuose nerandama išraiškos.
1 lentelė
Koreliacijos tipai ir jų apibrėžimai
Koreliacijos koeficiento apskaičiavimo metodas priklauso nuo skalės, kurioje matuojamos kintamojo reikšmės, tipo.
Koreliacijos koeficientas rPearsonas yra pagrindinis ir gali būti naudojamas kintamiesiems su vardinėmis ir iš dalies sutvarkytomis intervalų skalėmis, kurių reikšmių pasiskirstymas atitinka normalų (produkto momentų koreliacija). Pearsono koreliacijos koeficientas duoda gana tikslius rezultatus ir nenormalaus pasiskirstymo atvejais.
Jei skirstiniai nėra normalūs, geriau naudoti Spearman ir Kendall rango koreliacijos koeficientus. Jie reitinguojami, nes programa iš anksto reitinguoja koreliuojamus kintamuosius.
SPSS programa r-Spearman koreliaciją apskaičiuoja taip: pirmiausia kintamieji konvertuojami į rangus, o po to rangams pritaikoma Pirsono formulė.
M. Kendall pasiūlyta koreliacija paremta mintimi, kad ryšio kryptį galima spręsti lyginant tiriamuosius poromis. Jei poros subjektų X pokytis sutampa su Y pokyčiu, tai rodo teigiamą ryšį. Jei nesutampa, tai apie neigiamus santykius. Šį koeficientą daugiausia naudoja psichologai, dirbantys su mažomis imtimis. Kadangi sociologai dirba su dideliais duomenų masyvais, sunku rūšiuoti poras, nustatyti visų imties tiriamųjų porų santykinių dažnių ir inversijų skirtumus. Labiausiai paplitęs yra koeficientas. Pearsonas.
Kadangi koreliacijos koeficientas rPearson yra pagrindinis ir gali būti naudojamas (su tam tikra paklaida, priklausomai nuo skalės tipo ir pasiskirstymo nenormalumo lygio) visiems kintamiesiems, išmatuotiems kiekybinėmis skalėmis, apsvarstysime jo naudojimo pavyzdžius ir palyginsime rezultatai, gauti su matavimų rezultatais naudojant kitus koreliacijos koeficientus.
Koeficiento apskaičiavimo formulė r- Pearsonas:
r xy = ∑ (Xi-Xav)∙(Yi-Yav) / (N-1)∙σ x ∙σ y ∙
Kur: Xi, Yi – dviejų kintamųjų reikšmės;
Xav, Yav - dviejų kintamųjų vidutinės vertės;
σ x , σ y yra standartiniai nuokrypiai,
N yra stebėjimų skaičius.
Porų koreliacijos
Pavyzdžiui, norėtume išsiaiškinti, kaip skirtingų tipų tradicinių vertybių atsakymai koreliuoja studentų mintyse apie idealią darbo vietą (kintamieji: a9.1, a9.3, a9.5, a9.7) o tada apie liberaliųjų vertybių santykį (a9 .2, a9.4, a9.6, a9.8). Šie kintamieji matuojami 5 terminų skalėmis.
Naudojame procedūrą: „Analizė“, „Koreliacijos“, „Suporuotas“. Pagal numatytuosius nustatymus koeficientas Pearson nustatytas dialogo lange. Mes naudojame koeficientą Pearsonas
Išbandyti kintamieji perkeliami į pasirinkimo langą: a9.1, a9.3, a9.5, a9.7
Paspaudę OK, gauname skaičiavimą:
Koreliacijos
a9.1.t. Kiek svarbu turėti pakankamai laiko šeimai ir asmeniniam gyvenimui? |
Pearsono koreliacija |
||||
Vertė (dvipusė) |
|||||
a9.3.t. Kaip svarbu nebijoti prarasti darbą? |
Pearsono koreliacija |
||||
Vertė (dvipusė) |
|||||
a9.5.t. Kiek svarbu turėti tokį viršininką, kuris su tavimi pasitars priimdamas tokį ar kitą sprendimą? |
Pearsono koreliacija |
||||
Vertė (dvipusė) |
|||||
a9.7.t. Kiek svarbu dirbti gerai suderintoje komandoje, jaustis jos dalimi? |
Pearsono koreliacija |
||||
Vertė (dvipusė) |
|||||
** Koreliacija reikšminga 0,01 lygyje (dvipusė).
Sukurtos koreliacijos matricos kiekybinių verčių lentelė
Dalinės koreliacijos:
Pirmiausia sukurkime porinę koreliaciją tarp šių dviejų kintamųjų:
Koreliacijos |
|||
c8. Jauskitės artimi šalia gyvenantiems, kaimynams |
Pearsono koreliacija |
||
Vertė (dvipusė) |
|||
c12. Jauskitės artimi jų šeimai |
Pearsono koreliacija |
||
Vertė (dvipusė) |
|||
**. Koreliacija reikšminga 0,01 lygyje (dvipusė). |
Tada naudojame dalinės koreliacijos konstravimo procedūrą: „Analizė“, „Koreliacijos“, „Dalinė“.
Tarkime, kad reikšmė „Svarbu savarankiškai nustatyti ir keisti savo darbo tvarką“ nurodytų kintamųjų atžvilgiu bus lemiamas veiksnys, kurio įtakoje anksčiau nustatytas ryšys išnyks arba taps mažai reikšmingas. .
Koreliacijos |
||||
Išskirti kintamieji |
c8. Jauskitės artimi šalia gyvenantiems, kaimynams |
c12. Jauskitės artimi jų šeimai |
||
c16. Jauskitės artimi žmonėms, kurie turi tokius pat turtus kaip ir jūs |
c8. Jauskitės artimi šalia gyvenantiems, kaimynams |
Koreliacija |
||
Reikšmė (dvipusis) |
||||
c12. Jauskitės artimi jų šeimai |
Koreliacija |
|||
Reikšmė (dvipusis) |
||||
Kaip matyti iš lentelės, veikiant kontroliniam kintamajam, ryšys šiek tiek sumažėjo: nuo 0,120 iki 0,102. ji išlieka pakankamai aukšta ir leidžia paneigti nulinę hipotezę su nuline paklaida.
Koreliacijos koeficientas
Tiksliausias būdas nustatyti koreliacijos sandarumą ir pobūdį yra rasti koreliacijos koeficientą. Koreliacijos koeficientas yra skaičius, nustatomas pagal formulę:
čia r xy yra koreliacijos koeficientas;
x i -pirmojo požymio reikšmės;
i -antrojo požymio reikšmės;
Pirmojo požymio reikšmių aritmetinis vidurkis
Antrojo požymio reikšmių aritmetinis vidurkis
Norėdami naudoti formulę (32), sudarome lentelę, kurioje bus pateikta reikiama seka ruošiant skaičius, norint rasti koreliacijos koeficiento skaitiklį ir vardiklį.
Kaip matyti iš (32) formulės, veiksmų seka yra tokia: randame abiejų ženklų x ir y aritmetinius vidurkius, randame skirtumą tarp ženklo reikšmių ir jo vidurkio (х i - ) ir y i - ), tada randame jų sandaugą (х i - ) ( y i - ) – pastarųjų suma duoda koreliacijos koeficiento skaitiklį. Norint rasti jo vardiklį, reikia pakelti skirtumus (x i -) ir (y i -) kvadratu, rasti jų sumas ir iš jų sandaugos ištraukti kvadratinę šaknį.
Taigi, pavyzdžiui, 31, koreliacijos koeficiento nustatymas pagal (32) formulę gali būti pavaizduotas taip (50 lentelė).
Gautas koreliacijos koeficiento skaičius leidžia nustatyti ryšio buvimą, glaudumą ir pobūdį.
1. Jei koreliacijos koeficientas lygus nuliui, ryšio tarp požymių nėra.
2. Jei koreliacijos koeficientas lygus vienetui, ryšys tarp požymių yra toks didelis, kad virsta funkciniu.
3. Absoliuti koreliacijos koeficiento vertė neviršija intervalo nuo nulio iki vieneto:
Tai leidžia sutelkti dėmesį į jungties sandarumą: kuo koeficientas arčiau nulio, tuo ryšys silpnesnis, o kuo arčiau vienybės, tuo ryšys artimesnis.
4. Koreliacijos koeficiento ženklas "pliusas" reiškia tiesioginę koreliaciją, ženklas "minusas" reiškia priešingą.
Lentelė 50
x i | i | (х i - ) | (y i - ) | (x i - )(y i - ) | (х i - )2 | (y i - )2 |
14,00 | 12,10 | -1,70 | -2,30 | +3,91 | 2,89 | 5,29 |
14,20 | 13,80 | -1,50 | -0,60 | +0,90 | 2,25 | 0,36 |
14,90 | 14,20 | -0,80 | -0,20 | +0,16 | 0,64 | 0,04 |
15,40 | 13,00 | -0,30 | -1,40 | +0,42 | 0,09 | 1,96 |
16,00 | 14,60 | +0,30 | +0,20 | +0,06 | 0,09 | 0,04 |
17,20 | 15,90 | +1,50 | +2,25 | 2,25 | ||
18,10 | 17,40 | +2,40 | +2,00 | +4,80 | 5,76 | 4,00 |
109,80 | 101,00 | 12,50 | 13,97 | 13,94 |
Taigi 31 pavyzdyje apskaičiuotas koreliacijos koeficientas yra r xy = +0,9. leidžia padaryti tokias išvadas: yra koreliacija tarp tiriamų moksleivių dešinės ir kairės rankų raumenų jėgos dydžio (koeficientas r xy \u003d + 0,9 yra ne nulis), ryšys yra labai glaudus (koeficientas r xy \u003d + 0,9 yra artima vienybei), koreliacija yra tiesioginė (koeficientas r xy = +0,9 teigiamas), t.y., padidėjus vienos rankos raumenų jėgai, didėja kitos rankos jėga.
Skaičiuojant koreliacijos koeficientą ir naudojant jo savybes, reikia atsižvelgti į tai, kad išvados duoda teisingus rezultatus, kai požymiai yra normaliai pasiskirstę ir kai atsižvelgiama į daugelio abiejų požymių reikšmių ryšį.
Nagrinėjamame 31 pavyzdyje buvo analizuojamos tik 7 abiejų požymių reikšmės, kurių, žinoma, tokiems tyrimams nepakanka. Dar kartą primename, kad šioje knygoje apskritai ir konkrečiai šiame skyriuje pateikti pavyzdžiai yra iliustravimo metodai, o ne išsamus kokių nors mokslinių eksperimentų pristatymas. Dėl to atsižvelgiama į nedidelį skaičių savybių verčių, matavimai suapvalinami - visa tai daroma siekiant neužgožti metodo idėjos sudėtingais skaičiavimais.
Ypatingas dėmesys turėtų būti skiriamas nagrinėjamų santykių esmei. Koreliacijos koeficientas negali lemti teisingų tyrimo rezultatų, jei požymių santykio analizė atliekama formaliai. Grįžkime prie 31 pavyzdžio. Abu laikomi ženklai buvo dešinės ir kairės rankos raumenų jėgos vertės. Įsivaizduokime, kad požymiu x i 31 pavyzdyje (14,0; 14,2; 14,9... ...18,1) turime omenyje atsitiktinai sugautų žuvų ilgį centimetrais, o požymiu y i (12,1 ; 13,8; 14,2 ... ... 17.4) - instrumentų svoris laboratorijoje kilogramais. Formaliai, naudojant skaičiavimų aparatą koreliacijos koeficientui rasti ir šiuo atveju taip pat gauti r xy =+0>9, turėtume daryti išvadą, kad tarp žuvies ilgio ir žuvies svorio yra glaudus tiesioginio pobūdžio ryšys. instrumentus. Tokios išvados absurdiškumas akivaizdus.
Norint išvengti formalaus požiūrio į koreliacijos koeficiento naudojimą, reikėtų naudoti bet kurį kitą metodą – matematinį, loginį, eksperimentinį, teorinį – siekiant nustatyti ženklų koreliacijos galimybę, tai yra, aptikti organinę ženklų vienybę. Tik tada galima pradėti naudoti koreliacinę analizę ir nustatyti ryšio mastą bei pobūdį.
Matematinė statistika taip pat turi sąvoką daugialypė koreliacija- Santykiai tarp trijų ar daugiau funkcijų. Tokiais atvejais naudojamas daugkartinis koreliacijos koeficientas, susidedantis iš aukščiau aprašytų porinių koreliacijos koeficientų.
Pavyzdžiui, trijų ženklų – x і , y і , z і – koreliacijos koeficientas yra:
kur R xyz -daugkartinės koreliacijos koeficientas, išreiškiantis, kaip požymis x i priklauso nuo požymių y i ir z i ;
r xy -koreliacijos koeficientas tarp požymių x i ir y i ;
r xz - koreliacijos koeficientas tarp Xi ir Zi požymių;
r yz - koreliacijos koeficientas tarp požymių y i , z i
Koreliacinė analizė yra tokia:
Koreliacinė analizėKoreliacija- dviejų ar daugiau atsitiktinių dydžių (arba kintamųjų, kurie gali būti laikomi tokiais tam tikru priimtinu tikslumu) statistinis ryšys. Tuo pačiu metu vieno ar kelių šių dydžių pokyčiai lemia sistemingą kito ar kitų dydžių pasikeitimą. Koreliacijos koeficientas yra matematinis dviejų atsitiktinių dydžių koreliacijos matas.
Koreliacija gali būti teigiama ir neigiama (taip pat gali būti, kad nėra statistinio ryšio – pavyzdžiui, nepriklausomiems atsitiktiniams dydžiams). neigiama koreliacija - koreliacija, kai vieno kintamojo padidėjimas siejamas su kito kintamojo sumažėjimu, o koreliacijos koeficientas yra neigiamas. teigiama koreliacija - koreliacija, kai vieno kintamojo padidėjimas yra susijęs su kito kintamojo padidėjimu, o koreliacijos koeficientas yra teigiamas.
autokoreliacija - statistinis ryšys tarp atsitiktinių dydžių iš tos pačios serijos, bet paimtas su poslinkiu, pavyzdžiui, atsitiktiniam procesui - su laiko poslinkiu.
Statistinių duomenų apdorojimo metodas, kurį sudaro kintamųjų koeficientų (koreliacijų) tyrimas, vadinamas koreliacinė analizė.
Koreliacijos koeficientas
Koreliacijos koeficientas arba poros koreliacijos koeficientas tikimybių teorijoje ir statistikoje tai yra dviejų atsitiktinių dydžių kitimo pobūdžio rodiklis. Koreliacijos koeficientas žymimas lotyniška raide R ir gali būti nuo -1 iki +1. Jei modulio reikšmė yra arčiau 1, tai reiškia, kad yra stiprus ryšys (kai koreliacijos koeficientas lygus vienetui, jie kalba apie funkcinį ryšį), o jei arčiau 0, tada silpną.
Pearsono koreliacijos koeficientas
Metriniams dydžiams naudojamas Pearsono koreliacijos koeficientas, kurio tikslią formulę pristatė Francisas Galtonas:
Leisti X,Y- du atsitiktiniai dydžiai, apibrėžti toje pačioje tikimybių erdvėje. Tada jų koreliacijos koeficientas apskaičiuojamas pagal formulę:
![](https://i0.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
![](https://i1.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
kur cov yra kovariacija, o D yra dispersija arba lygiavertis,
,kur simbolis reiškia matematinį lūkestį.
Norėdami grafiškai pavaizduoti tokį ryšį, galite naudoti stačiakampę koordinačių sistemą su ašimis, atitinkančiomis abu kintamuosius. Kiekviena verčių pora pažymėta konkrečiu simboliu. Toks siužetas vadinamas „taškiniu“.
Koreliacijos koeficiento apskaičiavimo metodas priklauso nuo skalės, kuriai taikomi kintamieji, tipo. Taigi, norint matuoti kintamuosius intervalinėmis ir kiekybinėmis skalėmis, būtina naudoti Pirsono koreliacijos koeficientą (produktų momentų koreliaciją). Jei bent vienas iš dviejų kintamųjų turi eilės skalę arba nėra normaliai pasiskirstęs, reikia naudoti Spearmano rango koreliaciją arba Kendalo τ (tau). Tuo atveju, kai vienas iš dviejų kintamųjų yra dichotominis, naudojama taškinė dviejų eilučių koreliacija, o jei abu kintamieji yra dichotominiai – keturių laukų koreliacija. Koreliacijos koeficiento tarp dviejų nedichotominių kintamųjų skaičiavimas prasmingas tik tuo atveju, jei ryšys tarp jų yra tiesinis (vienakryptis).
Kendell koreliacijos koeficientas
Naudojamas tarpusavio sutrikimams matuoti.
Spearmano koreliacijos koeficientas
Koreliacijos koeficiento savybės
- Koši – Bunyakovskio nelygybė:
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
Koreliacinė analizė
Koreliacinė analizė- statistinių duomenų apdorojimo metodas, kurį sudaro koeficientų tyrimas ( koreliacijos) tarp kintamųjų. Šiuo atveju koreliacijos koeficientai tarp vienos poros ar kelių požymių porų yra lyginami, siekiant nustatyti statistinius ryšius tarp jų.
Tikslas koreliacinė analizė- pateikti šiek tiek informacijos apie vieną kintamąjį naudodami kitą kintamąjį. Tais atvejais, kai įmanoma pasiekti tikslą, sakome, kad kintamieji koreliuoti. Bendriausia forma koreliacijos buvimo hipotezės priėmimas reiškia, kad kintamojo A vertė pasikeis kartu su proporcingu B vertės pokyčiu: jei abu kintamieji didėja, tada koreliacija yra teigiama jei vienas kintamasis didėja, o kitas mažėja, koreliacija yra neigiama.
Koreliacija atspindi tik tiesinę dydžių priklausomybę, bet neatspindi jų funkcinio ryšio. Pavyzdžiui, jei apskaičiuosime koreliacijos koeficientą tarp reikšmių A = sin(x) ir B = cos(x), tada jis bus artimas nuliui, t.y., nėra priklausomybės tarp kiekių. Tuo tarpu dydžiai A ir B yra akivaizdžiai funkciškai susiję pagal įstatymą sin 2(x) + cos 2(x) = 1.
Koreliacinės analizės apribojimai
![](https://i1.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
![](https://i0.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
- Taikymas galimas, jei yra pakankamai tirtų atvejų: tam tikro tipo koreliacijos koeficientui jis svyruoja nuo 25 iki 100 stebėjimų porų.
- Antrasis apribojimas išplaukia iš koreliacinės analizės hipotezės, kuri apima kintamųjų tiesinė priklausomybė. Daugeliu atvejų, kai patikimai žinoma, kad priklausomybė egzistuoja, koreliacinė analizė gali neduoti rezultatų vien todėl, kad priklausomybė yra netiesinė (išreikšta, pavyzdžiui, parabole).
- Pats koreliacijos faktas nesuteikia pagrindo teigti, kuris iš kintamųjų yra prieš ar sukelia pokyčius, arba kad kintamieji paprastai yra vienas su kitu priežastiniu ryšiu, pavyzdžiui, dėl trečiojo veiksnio veikimo.
Taikymo sritis
Šis statistinių duomenų apdorojimo metodas yra labai populiarus ekonomikos ir socialiniuose moksluose (ypač psichologijoje ir sociologijoje), nors koreliacijos koeficientų taikymo sritis yra plati: pramonės produktų kokybės kontrolė, metalurgija, žemės ūkio chemija, hidrobiologija, biometrija, ir kiti.
Metodo populiarumą lėmė du punktai: koreliacijos koeficientus palyginti nesunku apskaičiuoti, jų taikymas nereikalauja specialaus matematinio pasirengimo. Kartu su aiškinimo paprastumu, koeficiento taikymo paprastumas paskatino jį plačiai naudoti statistinių duomenų analizės srityje.
netikra koreliacija
Dažnai viliojantis koreliacijos tyrimo paprastumas skatina tyrėją daryti klaidingas intuityvias išvadas apie priežastinio ryšio tarp požymių porų buvimą, o koreliacijos koeficientai nustato tik statistinius ryšius.
Šiuolaikinėje socialinių mokslų kiekybinėje metodikoje iš tikrųjų buvo atsisakyta bandymų empiriniais metodais nustatyti priežastinius ryšius tarp stebimų kintamųjų. Todėl, kai socialinių mokslų tyrėjai kalba apie santykių tarp tiriamų kintamųjų nustatymą, numanoma arba bendra teorinė prielaida, arba statistinė priklausomybė.
taip pat žr
- Autokoreliacijos funkcija
- Kryžminės koreliacijos funkcija
- kovariacija
- Determinacijos koeficientas
- Regresinė analizė
Wikimedia fondas. 2010 m.
Gali būti susijusios įvairios savybės.
Tarp jų yra 2 ryšių tipai:
- funkcinis;
- koreliacija.
Koreliacija išvertus į rusų kalbą – ne kas kita, kaip ryšys.
Koreliacijos atveju yra kelių vieno požymio reikšmių atitikimas kelioms kito atributo reikšmėms. Kaip pavyzdžius galime apsvarstyti nustatytas koreliacijas tarp:
- paukščių, tokių kaip garniai, gervės, gandrai, letenų, kaklo, snapo ilgis;
- kūno temperatūros ir širdies ritmo rodikliai.
Daugumos biomedicininių procesų atveju tokio ryšio buvimas buvo statistiškai įrodytas.
Statistiniai metodai leidžia nustatyti požymių tarpusavio priklausomybės egzistavimo faktą. Tam panaudojus specialius skaičiavimus, nustatomi koreliacijos koeficientai (jungiamumo matai).
Tokie skaičiavimai vadinami koreliacinė analizė. Ji atliekama siekiant patvirtinti 2 kintamųjų (atsitiktinių dydžių) priklausomybę vienas nuo kito, kuri išreiškiama koreliacijos koeficientu.
Koreliacijos metodo naudojimas leidžia išspręsti keletą problemų:
- nustatyti ryšį tarp analizuojamų parametrų;
- žinios apie koreliacijos buvimą leidžia spręsti prognozavimo problemas. Taigi, remiantis kito koreliuoto parametro elgsenos analize, yra reali galimybė numatyti parametro elgesį;
- klasifikacija, pagrįsta viena nuo kitos nepriklausomų požymių parinkimu.
Kintamiesiems:
- susijęs su eilės skale, apskaičiuojamas Spearman koeficientas;
- susiję su intervalų skale – Pirsono koeficientu.
Tai yra dažniausiai naudojami parametrai, tačiau yra ir kitų.
Koeficiento reikšmė gali būti išreikšta tiek teigiama, tiek neigiama.
Pirmuoju atveju, padidėjus vieno kintamojo reikšmei, pastebimas antrojo padidėjimas. Esant neigiamam koeficientui, modelis yra atvirkštinis.
Kam skirtas koreliacijos koeficientas?
Atsitiktiniai kintamieji, susieti vienas su kitu, gali turėti visiškai skirtingą šio ryšio pobūdį. Jis nebūtinai bus funkcionalus tuo atveju, kai tarp kiekių yra tiesioginis ryšys. Dažniausiai abu dydžius veikia visa aibė įvairių veiksnių, tais atvejais, kai jie yra bendri abiem dydžiams, stebimas susijusių dėsningumų formavimasis.
Tai reiškia, kad statistiškai įrodytas dydžių ryšio egzistavimo faktas nėra patvirtinimas, kad pastebėtų pokyčių priežastis nustatyta. Paprastai tyrėjas daro išvadą, kad yra dvi tarpusavyje susijusios pasekmės.
Koreliacijos koeficiento savybės
Ši statistika turi šias savybes:
- koeficiento reikšmė svyruoja nuo -1 iki +1. Kuo arčiau kraštutinių verčių, tuo stipresnis teigiamas arba neigiamas ryšys tarp tiesinių parametrų. Nulinės reikšmės atveju kalbame apie koreliacijos tarp požymių nebuvimą;
- teigiama koeficiento reikšmė rodo, kad, padidėjus vieno požymio reikšmei, stebimas antrojo padidėjimas (teigiama koreliacija);
- neigiama reikšmė - padidėjus vieno požymio reikšmei, stebimas antrojo sumažėjimas (neigiama koreliacija);
- rodiklio vertės artėjimas prie kraštutinių taškų (-1 arba +1) rodo, kad yra labai stiprus tiesinis ryšys;
- požymių rodikliai gali keistis esant pastoviai koeficiento reikšmei;
- koreliacijos koeficientas yra bematis dydis;
- koreliacijos buvimas nėra privalomas priežastinio ryšio patvirtinimas.
Koreliacijos koeficiento reikšmės
Koreliacijos stiprumą galima apibūdinti naudojant Cheldok skalę, kurioje kokybinė charakteristika atitinka tam tikrą skaitinę reikšmę.
Esant teigiamai koreliacijai pagal vertę:
- 0-0,3 - koreliacija labai silpna;
- 0,3-0,5 - silpnas;
- 0,5-0,7 - vidutinio stiprumo;
- 0,7-0,9 - aukštas;
- 0,9-1 – labai didelis koreliacijos stiprumas.
Skalė taip pat gali būti naudojama neigiamai koreliacijai. Šiuo atveju kokybinės charakteristikos pakeičiamos priešingomis.
Galite naudoti supaprastintą Cheldok skalę, kurioje išskiriamos tik 3 koreliacijos stiprumo gradacijos:
- labai stiprus - rodikliai ± 0,7 - ± 1;
- vidurkis - rodikliai ± 0,3 - ± 0,699;
- labai silpnas – rodikliai 0 – ± 0,299.
Šis statistinis rodiklis leidžia ne tik patikrinti tiesinio ryšio tarp požymių egzistavimo prielaidą, bet ir nustatyti jo stiprumą.
Koreliacijos koeficiento rūšys
Koreliacijos koeficientai gali būti klasifikuojami pagal ženklą ir reikšmę:
- teigiamas;
- nulinis;
- neigiamas.
Atsižvelgiant į analizuojamas vertes, apskaičiuojamas koeficientas:
- Pearsonas;
- Spearman;
- Kendala;
- Fechnerio ženklai;
- konkordancija arba daugkartinė koreliacija.
Pirsono koreliacijos koeficientas naudojamas tiesioginiams ryšiams tarp kintamųjų absoliučių verčių nustatyti. Šiuo atveju abiejų kintamųjų eilučių skirstiniai turėtų artėti prie normalaus. Lyginami kintamieji turėtų skirtis tuo pačiu skaičiumi skirtingų savybių. Kintamuosius vaizduojanti skalė turi būti intervalo skalė arba santykio skalė.
- tikslus koreliacijos stiprumo nustatymas;
- kiekybinių charakteristikų palyginimas.
Pirsono tiesinės koreliacijos koeficiento naudojimas turi keletą trūkumų:
- metodas yra nestabilus esant skaitinių reikšmių nuokrypiams;
- naudojant šį metodą koreliacijos stiprumą galima nustatyti tik tiesiniam ryšiui, kitiems kintamųjų tarpusavio ryšių tipams reikėtų taikyti regresinės analizės metodus.
Rango koreliacija nustatoma Spearman metodu, leidžiančiu statistiškai ištirti ryšį tarp reiškinių. Šio koeficiento dėka apskaičiuojamas faktinis dviejų kiekybiškai išreikštų požymių eilučių lygiagretumo laipsnis, taip pat įvertinamas nustatyto ryšio glaudumas.
- nereikalaujant tiksliai apibrėžti koreliacijos stiprumo vertę;
- lyginami rodikliai turi ir kiekybines, ir atributines reikšmes;
- požymių eilučių palyginimas su atvirais reikšmių variantais.
Spearmano metodas susijęs su neparametrinės analizės metodais, todėl nereikia tikrinti ypatybių pasiskirstymo normalumo. Be to, tai leidžia palyginti skirtingomis skalėmis išreikštus rodiklius. Pavyzdžiui, lyginant raudonųjų kraujo kūnelių skaičiaus vertes tam tikrame kraujo tūryje (nuolatinė skalė) ir ekspertų vertinimą, išreikštą taškais (eilės skalė).
Metodo efektyvumą neigiamai veikia didelis palyginamų verčių reikšmių skirtumas. Metodas taip pat neefektyvus tais atvejais, kai išmatuotai vertei būdingas netolygus reikšmių pasiskirstymas.
Žingsnis po žingsnio koreliacijos koeficiento skaičiavimas programoje Excel
Koreliacijos koeficiento apskaičiavimas apima nuoseklų matematinių operacijų vykdymą.
Aukščiau pateikta Pirsono koeficiento apskaičiavimo formulė parodo, koks sunkus šis procesas, jei jis atliekamas rankiniu būdu.
Naudojant „Excel“ galimybes, kartais paspartėja koeficiento paieškos procesas.
Pakanka laikytis paprasto veiksmų algoritmo:
- pagrindinės informacijos įvedimas - x reikšmių stulpelis ir y reikšmių stulpelis;
- įrankiuose pasirenkamas ir atidaromas skirtukas Formulės;
- atsidariusiame skirtuke pasirinkite „Įterpti fx funkciją“;
- atsidariusiame dialogo lange pasirenkama statistinė funkcija „Korelis“, leidžianti apskaičiuoti koreliacijos koeficientą tarp 2 duomenų masyvų;
- atsidariusiame lange įvedami duomenys: 1 masyvas - x stulpelio reikšmių diapazonas (duomenys turi būti pasirinkti), 2 masyvas - y stulpelio verčių diapazonas;
- paspaudžiamas klavišas „OK“, koeficiento apskaičiavimo rezultatas rodomas eilutėje „reikšmė“;
- išvada dėl koreliacijos tarp 2 duomenų rinkinių ir jos stiprumo.
Koreliacijos modelis (CM) – tai skaičiavimo programa, kuri pateikia matematinę lygtį, kurioje gautas rodiklis kiekybiškai įvertinamas priklausomai nuo vieno ar kelių rodiklių.
yx \u003d ao + a1x1
čia: y - veiklos rodiklis, priklausomai nuo koeficiento x;
x - faktoriaus ženklas;
a1 - parametras KM, rodantis, kiek pasikeis efektyvusis rodiklis y, kai veiksnys x pasikeis vienu, jei tuo pačiu visi kiti veiksniai, turintys įtakos y, išliks nepakitę;
ao - parametras KM, parodantis visų kitų veiksnių įtaką efektyviajam rodikliui y, išskyrus faktoriaus ženklą x
Renkantis modelio efektyvius ir faktorinius rodiklius, būtina atsižvelgti į tai, kad efektyvus rodiklis priežasties-pasekmės ryšių grandinėje yra aukštesnio lygio nei faktorių rodikliai.
Koreliacijos modelio charakteristikos
Apskaičiavus koreliacijos modelio parametrus, apskaičiuojamas koreliacijos koeficientas.
p - poros koreliacijos koeficientas, -1 ≤ p ≤ 1, parodo veiksnio rodiklio įtakos efektyviajam stiprumą ir kryptį. Kuo arčiau 1, tuo stipresni santykiai, kuo arčiau 0, tuo santykiai silpnesni. Jei koreliacijos koeficientas yra teigiamas, tai ryšys yra tiesioginis, jei neigiamas, jis yra atvirkštinis.
Koreliacijos koeficiento formulė: pxy \u003d (xy-x * 1 / y) / eh * eu
ex=xx2-(x)2 ; eu=y2-(y)2
Jei CM yra tiesinis daugiafaktorinis, kurio forma:
yx \u003d ao + a1x1 + a2x2 + ... + axp
tada jam apskaičiuojamas daugkartinis koreliacijos koeficientas.
0 ≤ Р ≤ 1 ir parodo visų faktorių rodiklių, paimtų kartu, įtakos efektyviajam stiprumą.
P \u003d 1- ((uh-uy) 2 / (yi - usr) 2)
Kur: uh - efektyvus rodiklis - apskaičiuota vertė;
ui – faktinė vertė;
usr - faktinė vertė, vidurkis.
Apskaičiuota reikšmė yx gaunama pakeitus koreliacijos modelį vietoj x1, x2 ir pan. jų tikrosios vertės.
Vieno veiksnio ir kelių faktorių netiesiniams modeliams koreliacijos santykis apskaičiuojamas:
1 ≤ m ≤ 1;
Manoma, kad efektyvaus ir faktorinio rodiklių, įtrauktų į modelį, ryšys yra silpnas, jei ryšio glaudumo koeficiento (m) reikšmė yra 0-0,3 ribose; jei 0,3-0,7 - jungties sandarumas yra vidutinis; virš 0,7-1 - ryšys stiprus.
Kadangi koreliacijos koeficientas (suporuotas) p, koreliacijos koeficientas (daugkartinis) P, koreliacijos santykis m yra tikimybinės reikšmės, tai joms apskaičiuojami jų reikšmingumo koeficientai (natomi iš lentelių). Jei šie koeficientai yra didesni nei jų lentelės reikšmės, tai ryšio glaudumo koeficientai yra svarbios priežastys. Jei jungties sandarumo reikšmingumo koeficientai yra mažesni už lentelės reikšmes arba pats sujungimo koeficientas yra mažesnis nei 0,7, tai į modelį įtraukiami ne visi faktorių rodikliai, kurie reikšmingai įtakoja rezultatą.
Determinacijos koeficientas aiškiai parodo į modelį įtrauktų faktorių rodiklių, lemiančių rezultato susidarymą, procentą.
Jei determinacijos koeficientas yra didesnis nei 50, tada modelis tinkamai apibūdina tiriamą procesą, jei jis yra mažesnis nei 50, tada reikia grįžti į pirmąjį statybos etapą ir peržiūrėti faktorių rodiklių pasirinkimą, kad jie būtų įtraukti į modelis.
Fišerio koeficientas arba Fišerio kriterijus apibūdina viso modelio efektyvumą. Jeigu apskaičiuota koeficiento reikšmė viršija lentelės reikšmę, tai sukonstruotas modelis tinka analizei, taip pat rodiklių planavimui, skaičiavimams ateičiai. Apytikslė lentelės vertė \u003d 1,5. Jei apskaičiuota vertė yra mažesnė už lentelės vertę, pirmiausia reikia sukurti modelį, įskaitant veiksnius, kurie reikšmingai įtakoja rezultatą. Be viso modelio efektyvumo, kiekvienas regresijos koeficientas turi įtakos reikšmingumui. Jei apskaičiuota šio koeficiento reikšmė viršijo lentelės reikšmę, tai regresijos koeficientas bus reikšmingas, jei mažesnis, tai veiksnio rodiklis, kuriam skaičiuojamas šis koeficientas, pašalinamas iš imties, skaičiavimai pradedami iš naujo, bet be šio koeficiento .
Koreliacijos koeficientas yra dviejų kintamųjų ryšio laipsnis. Jo apskaičiavimas leidžia suprasti, ar yra ryšys tarp dviejų duomenų rinkinių. Skirtingai nuo regresijos, koreliacija neleidžia numatyti verčių. Tačiau koeficiento apskaičiavimas yra svarbus išankstinės statistinės analizės žingsnis. Pavyzdžiui, nustatėme, kad koreliacijos koeficientas tarp tiesioginių užsienio investicijų lygio ir BVP augimo yra aukštas. Tai leidžia suprasti, kad klestėjimui užtikrinti būtina sukurti palankų klimatą būtent užsienio verslininkams. Iš pirmo žvilgsnio ne tokia akivaizdi išvada!
Koreliacija ir priežastinis ryšys
Galbūt nėra nė vienos statistikos srities, kuri būtų taip tvirtai įsitvirtinusi mūsų gyvenime. Koreliacijos koeficientas naudojamas visose viešųjų žinių srityse. Pagrindinis jo pavojus slypi tame, kad dažnai spėliojama apie aukštas jo vertybes, siekiant įtikinti žmones ir priversti juos patikėti tam tikromis išvadomis. Tačiau iš tikrųjų stipri koreliacija visiškai nerodo priežastinio ryšio tarp kiekių.
Koreliacijos koeficientas: Pirsono ir Spearmano formulė
Yra keletas pagrindinių rodiklių, apibūdinančių ryšį tarp dviejų kintamųjų. Istoriškai pirmasis yra Pirsono tiesinės koreliacijos koeficientas. Jis perduodamas mokykloje. Ją sukūrė K. Pearsonas ir J. Yule, remdamiesi kun. Galtonas. Šis koeficientas leidžia matyti ryšį tarp racionaliai besikeičiančių racionalių skaičių. Jis visada didesnis nei -1 ir mažesnis už 1. Neigiamas skaičius rodo atvirkščiai proporcingą ryšį. Jei koeficientas lygus nuliui, tai ryšio tarp kintamųjų nėra. Lygus teigiamam skaičiui – tarp tiriamų dydžių yra tiesiogiai proporcingas ryšys. Spearmano rango koreliacijos koeficientas leidžia supaprastinti skaičiavimus, sukuriant kintamųjų reikšmių hierarchiją.
Ryšiai tarp kintamųjų
Koreliacija padeda atsakyti į du klausimus. Pirma, ar ryšys tarp kintamųjų yra teigiamas ar neigiamas. Antra, kokia stipri yra priklausomybė. Koreliacinė analizė yra galingas įrankis šiai svarbiai informacijai gauti. Nesunku pastebėti, kad namų ūkių pajamos ir išlaidos proporcingai didėja ir mažėja. Tokie santykiai laikomi teigiamais. Priešingai, kai prekės kaina kyla, jos paklausa krenta. Tokie santykiai vadinami neigiamais. Koreliacijos koeficiento reikšmės yra nuo -1 iki 1. Nulis reiškia, kad tarp tiriamų verčių nėra ryšio. Kuo rodiklis arčiau kraštutinių verčių, tuo ryšys stipresnis (neigiamas ar teigiamas). Priklausomybės nebuvimą liudija koeficientas nuo -0,1 iki 0,1. Reikia suprasti, kad tokia reikšmė tik rodo tiesinio ryšio nebuvimą.
Taikymo ypatybės
Abiejų rodiklių naudojimas priklauso nuo tam tikrų prielaidų. Pirma, tvirtų santykių buvimas nenulemia to, kad viena vertybė lemia kitą. Gali būti, kad kiekvieną iš jų apibrėžia trečiasis dydis. Antra, didelis Pearsono koreliacijos koeficientas nerodo priežastinio ryšio tarp tiriamų kintamųjų. Trečia, tai rodo išskirtinai linijinį ryšį. Koreliacija gali būti naudojama vertinant reikšmingus kiekybinius duomenis (pvz., barometrinį slėgį, oro temperatūrą), o ne kategorijas, tokias kaip lytis ar mėgstama spalva.
Daugialypis koreliacijos koeficientas
Pearsonas ir Spearmanas ištyrė ryšį tarp dviejų kintamųjų. Bet ką daryti, jei jų yra trys ar net daugiau. Čia atsiranda daugialypis koreliacijos koeficientas. Pavyzdžiui, bendrajam nacionaliniam produktui įtakos turi ne tik tiesioginės užsienio investicijos, bet ir valstybės pinigų bei fiskalinė politika, eksporto lygis. BVP augimo tempas ir apimtis yra daugelio veiksnių sąveikos rezultatas. Tačiau reikia suprasti, kad daugialypės koreliacijos modelis yra pagrįstas daugybe supaprastinimų ir prielaidų. Pirma, daugiakolineariškumas tarp dydžių neįtraukiamas. Antra, ryšys tarp priklausomo kintamojo ir jį veikiančių kintamųjų yra tiesinis.
Koreliacinės ir regresinės analizės panaudojimo sritys
Šis dydžių ryšio nustatymo metodas plačiai naudojamas statistikoje. Dažniausiai kreipiamasi į tris pagrindinius atvejus:
- Norėdami patikrinti priežastinius ryšius tarp dviejų kintamųjų verčių. Dėl to tyrėjas tikisi rasti tiesinį ryšį ir išvesti formulę, apibūdinančią šiuos ryšius tarp dydžių. Jų matavimo vienetai gali skirtis.
- Patikrinti ryšį tarp vertybių. Šiuo atveju niekas nenustato, kuris kintamasis yra priklausomas. Gali pasirodyti, kad abiejų dydžių vertė lemia kokį nors kitą veiksnį.
- Išvesti lygtį. Tokiu atveju galite tiesiog pakeisti skaičius ir sužinoti nežinomo kintamojo reikšmes.
Vyras, ieškantis priežastinio ryšio
Sąmonė yra išdėstyta taip, kad mums būtinai reikia paaiškinti aplink vykstančius įvykius. Žmogus visada ieško ryšio tarp pasaulio, kuriame gyvena, paveikslo ir gaunamos informacijos. Dažnai smegenys sukuria tvarką iš chaoso. Jis lengvai mato priežastinį ryšį ten, kur jo nėra. Mokslininkai turi specialiai išmokti įveikti šią tendenciją. Gebėjimas įvertinti ryšius tarp duomenų yra objektyviai būtinas akademinėje karjeroje.
Žiniasklaidos šališkumas
Apsvarstykite, kaip koreliacijos buvimas gali būti neteisingai interpretuojamas. Grupės netinkamai besielgiančių britų studentų buvo paklausti, ar jų tėvai rūko. Tada testas buvo paskelbtas laikraštyje. Rezultatas parodė stiprų ryšį tarp tėvų rūkymo ir jų vaikų nusikalstamumo. Šį tyrimą atlikęs profesorius netgi pasiūlė ant cigarečių pakelių uždėti apie tai įspėjimą. Tačiau su šia išvada kyla nemažai problemų. Pirma, koreliacija nenurodo, kuris iš dydžių yra nepriklausomas. Todėl visai galima daryti prielaidą, kad žalingą tėvų įprotį lemia vaikų nepaklusnumas. Antra, negalima tvirtai teigti, kad abi problemos nekilo dėl kažkokio trečiojo veiksnio. Pavyzdžiui, mažas pajamas gaunančios šeimos. Atkreiptinas dėmesys į emocinį pradinių tyrimą atlikusio profesoriaus išvadų aspektą. Jis buvo aršus rūkymo priešininkas. Todėl nenuostabu, kad jis taip interpretavo savo tyrimo rezultatus.
išvadas
Klaidingai interpretuojant koreliaciją kaip priežastinį ryšį tarp dviejų kintamųjų, gali atsirasti nepatogių tyrimo klaidų. Problema ta, kad ji slypi pačioje žmogaus sąmonės šerdyje. Daugelis rinkodaros gudrybių yra pagrįstos šia funkcija. Skirtumo tarp priežastinio ryšio ir koreliacijos supratimas leidžia racionaliai analizuoti informaciją tiek kasdieniame gyvenime, tiek profesinėje karjeroje.