Çfarë është korrelacioni në statistika. Koeficienti i korrelacionit është një karakteristikë e modelit të korrelacionit. Si të interpretohet vlera e koeficientit të korrelacionit Pearson

» Statistikat

Statistikat dhe përpunimi i të dhënave në psikologji
(vazhdim)

Analiza e korrelacionit

Kur studioni korrelacionet përpiquni të përcaktoni nëse ka ndonjë lidhje midis dy treguesve në të njëjtin kampion (për shembull, midis gjatësisë dhe peshës së fëmijëve ose midis nivelit IQ dhe performancën e shkollës) ose midis dy mostrave të ndryshme (për shembull, kur krahasohen çiftet e binjakëve), dhe nëse kjo marrëdhënie ekziston, nëse një rritje në një tregues shoqërohet me një rritje (korrelacion pozitiv) ose një ulje (korrelacion negativ) të tjera.

Me fjalë të tjera, analiza e korrelacionit ndihmon për të përcaktuar nëse është e mundur të parashikohen vlerat e mundshme të një treguesi, duke ditur vlerën e një tjetri.

Deri më tani, kur analizojmë rezultatet e përvojës sonë në studimin e efekteve të marihuanës, ne kemi injoruar qëllimisht një tregues të tillë si koha e reagimit. Ndërkohë, do të ishte interesante të kontrollohej nëse ka një lidhje midis efikasitetit të reaksioneve dhe shpejtësisë së tyre. Kjo do të lejonte, për shembull, të argumentohej se sa më i ngadalshëm të jetë një person, aq më të sakta dhe efektive do të jenë veprimet e tij dhe anasjelltas.

Për këtë qëllim mund të përdoren dy metoda të ndryshme: metoda parametrike e llogaritjes së koeficientit Bravais-Pearson (r) dhe llogaritja e koeficientit të korrelacionit të rangut të Spearman (r s), i cili zbatohet për të dhënat rendore, d.m.th. është joparametrik. Sidoqoftë, së pari le të kuptojmë se çfarë është një koeficient korrelacioni.

Koeficienti i korrelacionit

Koeficienti i korrelacionit është një vlerë që mund të ndryshojë nga +1 në -1. Në rastin e një korrelacioni të plotë pozitiv, ky koeficient është i barabartë me plus 1, dhe në rastin e një korrelacioni të plotë negativ, është minus 1. Në grafik, kjo korrespondon me një vijë të drejtë që kalon nëpër pikat e kryqëzimit të vlerat e çdo çifti të dhënash:

Nëse këto pika nuk rreshtohen në një vijë të drejtë, por formojnë një "re", vlera absolute e koeficientit të korrelacionit bëhet më e vogël se një dhe i afrohet zeros kur reja rrumbullakohet:

Nëse koeficienti i korrelacionit është 0, të dy variablat janë plotësisht të pavarur nga njëri-tjetri.

Në shkencat humane, një korrelacion konsiderohet i fortë nëse koeficienti i tij është më i madh se 0.60; nëse kalon 0.90, atëherë korrelacioni konsiderohet shumë i fortë. Megjithatë, për të qenë në gjendje të nxirren përfundime rreth marrëdhënieve midis variablave, madhësia e kampionit ka një rëndësi të madhe: sa më i madh të jetë kampioni, aq më e besueshme është vlera e koeficientit të korrelacionit të marrë. Ekzistojnë tabela me vlera kritike të koeficientëve të korrelacionit Bravais-Pearson dhe Spearman për një numër të ndryshëm të shkallëve të lirisë (është e barabartë me numrin e çifteve minus 2, d.m.th. n- 2). Vetëm nëse koeficientët e korrelacionit janë më të mëdhenj se këto vlera kritike, ato mund të konsiderohen të besueshme. Pra, në mënyrë që koeficienti i korrelacionit prej 0.70 të jetë i besueshëm, duhet të merren të paktën 8 palë të dhëna në analizë. ( h =n-2=6) kur llogaritet r (shih Tabelën 4 në Shtojcë) dhe 7 çifte të dhënash (h = n-2= 5) gjatë llogaritjes së r s (Tabela 5 në Shtojcë).

Dua të theksoj edhe një herë se thelbi i këtyre dy koeficientëve është disi i ndryshëm. Koeficienti negativ r tregon se efikasiteti është më shpesh sa më i lartë, aq më i shpejtë është koha e reagimit, ndërsa gjatë llogaritjes së koeficientit r s ishte e nevojshme të kontrollohej nëse subjektet më të shpejtë reagojnë gjithmonë më saktë, dhe subjektet më të ngadalta më pak saktë.

Koeficienti i korrelacionit Bravais-Pearson (r) - Ky është një tregues parametrik, për llogaritjen e të cilit krahasohen devijimet mesatare dhe standarde të rezultateve të dy matjeve. Në këtë rast, përdoret një formulë (mund të duket ndryshe për autorë të ndryshëm)

ku Σ XY- shuma e produkteve të të dhënave nga çdo çift;
n është numri i çifteve;
X - mesatarja për variablin e dhënë x;
Y - mesatare për të dhënat e ndryshueshme Y
Sx- devijimi standard për shpërndarje X;
Sy- devijimi standard për shpërndarje në

Koeficienti i korrelacionit të gradës Spearman ( rs ) - ky është një tregues joparametrik, me ndihmën e të cilit ata përpiqen të zbulojnë marrëdhënien midis radhëve të sasive përkatëse në dy seri matjesh.

Ky koeficient është më i lehtë për t'u llogaritur, por rezultatet janë më pak të sakta sesa përdorimi i r. Kjo për faktin se gjatë llogaritjes së koeficientit Spearman përdoret rendi i të dhënave dhe jo karakteristikat e tyre sasiore dhe intervalet midis klasave.

Fakti është se kur përdorin koeficientin e korrelacionit të gradave Spearman (r s), ata kontrollojnë vetëm nëse renditja e të dhënave për çdo kampion do të jetë e njëjtë si në një seri të dhënash të tjera për këtë kampion, në çift të lidhur me të parën (për shembull , nëse do të jenë të njëjtat "të renditura" nga studentët si në psikologji ashtu edhe në matematikë, apo edhe me dy mësues të ndryshëm të psikologjisë?). Nëse koeficienti është afër +1, atëherë kjo do të thotë që të dyja seritë praktikisht përkojnë, dhe nëse ky koeficient është afër -1, mund të flasim për një marrëdhënie të kundërt të plotë.

Koeficient rs llogaritet sipas formulës

ku dështë ndryshimi midis gradave të vlerave të veçorive të konjuguara (pavarësisht nga shenja e tij) dhe është numri i çifteve.

Në mënyrë tipike, ky test joparametrik përdoret në rastet kur duhet të nxirrni disa përfundime jo aq shumë për intervale mes të dhënave, sa për to gradat, dhe gjithashtu kur lakoret e shpërndarjes janë shumë të shtrembëruara dhe nuk lejojnë përdorimin e kritereve parametrike siç është koeficienti r (në këto raste mund të jetë e nevojshme që të dhënat sasiore të kthehen në të dhëna rendore).

Përmbledhje

Pra, ne kemi shqyrtuar metoda të ndryshme statistikore parametrike dhe joparametrike të përdorura në psikologji. Rishikimi ynë ishte shumë sipërfaqësor dhe detyra e tij kryesore ishte t'i bënte lexuesit të kuptonte se statistikat nuk janë aq të frikshme sa duken dhe kërkojnë kryesisht sens të përbashkët. Kujtojmë se të dhënat e “përvojës” me të cilat jemi marrë këtu janë fiktive dhe nuk mund të shërbejnë si bazë për asnjë përfundim. Sidoqoftë, një eksperiment i tillë ia vlen të bëhej. Meqenëse për këtë eksperiment u zgjodh një teknikë thjesht klasike, e njëjta analizë statistikore mund të përdoret në shumë eksperimente të ndryshme. Në çdo rast, na duket se kemi përvijuar disa drejtime kryesore që mund të jenë të dobishme për ata që nuk dinë se ku ta nisin analizën statistikore të rezultateve.

Letërsia

Godefroy J.Çfarë është psikologjia. - M., 1992.
Chatillon G., 1977. Statistique en Sciences Humaines, Trois-Rivieres, Ed. SMG.
Gilbert N. 1978. Statistika, Montreal, Ed. H.R.W.
Moroney M.J., 1970. Comprendre la statistique, Verviers, Gerard et Cie.
Siegel S., 1956. Statistikat joparametrike, Nju Jork, MacGraw-Hill Book Co.

Aplikimi për fletëllogaritëse

Shënime. 1) Për mostra të mëdha ose nivele të rëndësisë më pak se 0.05, referojuni tabelave në tekstet statistikore.

2) Tabelat e vlerave për kritere të tjera joparametrike mund të gjenden në udhëzime të veçanta (shih bibliografinë).

Tabela 1. Vlerat e kriterit t Studenti
h	0,05
1	6,31
2	2,92
3	2,35
4	2,13
5	2,02
6	1,94
7	1,90
8	1,86
9	1,83
10	1,81
11	1,80
12	1,78
13	1,77
14	1,76
15	1,75
16	1,75
17	1,74
18	1,73
19	1,73
20	1,73
21	1,72
22	1,72
23	1,71
24	1,71
25	1,71
26	1,71
27	1,70
28	1,70
29	1,70
30	1,70
40	1,68
¥	1,65

Tabela 2. Vlerat e kriterit χ 2
h	0,05
1	3,84
2	5,99
3	7,81
4	9,49
5	11,1
6	12,6
7	14,1
8	15,5
9	16,9
10	18,3

Tabela 3. Vlerat e besueshme Z
R	Z
0,05	1,64
0,01	2,33

Tabela 4. Vlerat e besueshme (kritike) të r
h =(N-2)		p= 0,05 (5%)
3		0,88
4		0,81
5		0,75
6		0,71
7		0,67
8		0,63
9		0,60
10		0,58
11		0.55
12		0,53
13		0,51
14		0,50
15		0,48
16		0,47
17		0,46
18		0,44
19		0,43
20		0,42

Tabela 5. Vlerat e besueshme (kritike) të r s
h =(N-2)	p = 0,05
2	1,000
3	0,900
4	0,829
5	0,714
6	0,643
7	0,600
8	0,564
10	0,506
12	0,456
14	0,425
16	0,399
18	0,377
20	0,359
22	0,343
24	0,329
26	0,317
28	0,306

Koeficienti i korrelacionitështë një vlerë që mund të ndryshojë nga +1 në -1. Në rastin e një korrelacioni të plotë pozitiv, ky koeficient është i barabartë me plus 1 (ata thonë se me një rritje në vlerën e një ndryshoreje, vlera e një ndryshoreje tjetër rritet), dhe me një korrelacion të plotë negativ - minus 1 (tregoni reagimet d.m.th kur vlerat e njërës ndryshore rriten, vlerat e tjetrës zvogëlohen).

Shembulli 1:

Grafiku i varësisë së ndrojtjes dhe depresionit. Siç mund ta shihni, pikat (subjektet) nuk janë të vendosura në mënyrë të rastësishme, por rreshtohen rreth një rreshti dhe, duke parë këtë vijë, mund të themi se sa më e lartë të shprehet ndrojtja tek një person, aq më depresive, pra këto dukuri. janë të ndërlidhura.

Shembulli 2: Grafiku për drojën dhe shoqërueshmërinë. Shohim që me rritjen e ndrojtjes, zvogëlohet shoqërueshmëria. Koeficienti i korrelacionit të tyre është -0.43. Kështu, një koeficient korrelacioni më i madh nga 0 në 1 tregon një marrëdhënie proporcionale (sa më shumë ... aq më shumë ...), dhe një koeficient nga -1 në 0 tregon një marrëdhënie në përpjesëtim të zhdrejtë (sa më shumë ... aq më pak . ..)

Nëse koeficienti i korrelacionit është 0, të dy variablat janë plotësisht të pavarur nga njëri-tjetri.

korrelacioni- kjo është një marrëdhënie ku ndikimi i faktorëve individualë shfaqet vetëm si tendencë (mesatarisht) me vëzhgimin masiv të të dhënave aktuale. Shembuj të varësisë së korrelacionit mund të jenë varësia midis madhësisë së aktiveve të bankës dhe shumës së fitimit të bankës, rritja e produktivitetit të punës dhe kohëzgjatja e shërbimit të punonjësve.

Përdoren dy sisteme të klasifikimit të korrelacioneve sipas fuqisë së tyre: të përgjithshme dhe të veçanta.

Klasifikimi i përgjithshëm i korrelacioneve: 1) i fortë ose i ngushtë me një koeficient korrelacioni r> 0.70; 2) i mesëm në 0.500.70, dhe jo vetëm një korrelacion i një niveli të lartë rëndësie.

Tabela e mëposhtme liston emrat e koeficientëve të korrelacionit për lloje të ndryshme shkallësh.

	Shkalla dikotomike (1/0)	Shkalla e gradave (rendore).
Shkalla dikotomike (1/0)	Koeficienti i shoqërimit të Pearson-it, koeficienti i konjugimit me katër qeliza të Pearson-it.		Korrelacioni biserial
Shkalla e gradave (rendore).	Korrelacioni rang-biserial.	Koeficienti i korrelacionit të gradës së Spearman ose Kendall.
Intervali dhe shkalla absolute	Korrelacioni biserial	Vlerat e shkallës së intervalit shndërrohen në gradë dhe përdoret koeficienti i renditjes	Koeficienti i korrelacionit Pearson (koeficienti i korrelacionit linear)

Në r=0 nuk ka korrelacion linear. Në këtë rast, mesataret e grupit të variablave përputhen me mesataret e tyre të përgjithshme, dhe linjat e regresionit janë paralele me boshtet koordinative.

Barazia r=0 flet vetëm për mungesën e një varësie korrelacioni linear (variabla të pakorreluara), por jo në përgjithësi për mungesën e një korrelacioni dhe aq më tepër për një varësi statistikore.

Ndonjëherë përfundimi se nuk ka korrelacion është më i rëndësishëm se prania e një korrelacioni të fortë. Një korrelacion zero i dy variablave mund të tregojë se nuk ka ndikim të njërës ndryshore në tjetrën, me kusht që t'u besojmë rezultateve të matjeve.

Në SPSS: 11.3.2 Koeficientët e korrelacionit

Deri më tani, ne kemi zbuluar vetëm faktin e ekzistencës së një marrëdhënie statistikore midis dy veçorive. Më tej, ne do të përpiqemi të zbulojmë se cilat përfundime mund të nxirren për forcën ose dobësinë e kësaj varësie, si dhe për formën dhe drejtimin e saj. Kriteret për përcaktimin sasior të marrëdhënies ndërmjet variablave quhen koeficientë korrelacioni ose masa të lidhjes. Dy variabla janë të korreluara pozitivisht nëse ka një marrëdhënie të drejtpërdrejtë, të njëanshme midis tyre. Në një marrëdhënie të njëanshme, vlerat e vogla të njërës ndryshore korrespondojnë me vlerat e vogla të ndryshores tjetër, vlerat e mëdha korrespondojnë me ato të mëdha. Dy variabla janë të korreluara negativisht nëse ka një lidhje të anasjelltë midis tyre. Me një marrëdhënie shumëdrejtimëshe, vlerat e vogla të njërës ndryshore korrespondojnë me vlerat e mëdha të ndryshores tjetër dhe anasjelltas. Vlerat e koeficientëve të korrelacionit janë gjithmonë në rangun nga -1 në +1.

Koeficienti i Spearman-it përdoret si koeficient korrelacioni midis variablave që i përkasin shkallës rendore dhe koeficienti i korrelacionit të Pearson (momenti i produkteve) përdoret për variablat që i përkasin shkallës së intervalit. Në këtë rast, duhet theksuar se çdo ndryshore dikotomike, pra një variabël që i përket shkallës nominale dhe ka dy kategori, mund të konsiderohet si rendore.

Së pari, do të kontrollojmë nëse ka një korrelacion midis variablave të seksit dhe psikikës nga skedari studium.sav. Duke vepruar kështu, marrim parasysh se ndryshorja dikotomike seksi mund të konsiderohet si një ndryshore rendore. Bëni sa vijon:

Zgjidhni nga menyja e komandave Analiza (Analiza) Statistikat përshkruese (Statistikat përshkruese) Crosstabs... (Tabelat e paparashikuara)

· Zhvendosni variablin seks në një listë rreshtash dhe psikikën e ndryshueshme në një listë kolonash.

· Klikoni butonin Statistika.... Në dialogun Crosstabs: Statistics, kontrolloni kutinë Korrelacione. Konfirmoni zgjedhjen tuaj me butonin Vazhdo.

· Në dialogun Crosstabs, ndaloni shfaqjen e tabelave duke kontrolluar kutinë e kontrollit Supress tabelat. Klikoni butonin OK.

Do të llogariten koeficientët e korrelacionit Spearman dhe Pearson dhe do të testohet rëndësia e tyre:

/ SPSS 10

Detyra numër 10 Analiza e korrelacionit

Koncepti i korrelacionit

Korrelacioni ose koeficienti i korrelacionit është një tregues statistikor probabilistike marrëdhëniet ndërmjet dy variablave të matura në shkallë sasiore. Në ndryshim nga lidhja funksionale, në të cilën çdo vlerë e një ndryshoreje korrespondon të përcaktuara rreptësisht vlera e një ndryshoreje tjetër, lidhje probabilistike karakterizohet nga fakti se çdo vlerë e një ndryshoreje i përgjigjet grup vlerash Një variabël tjetër, një shembull i një marrëdhënieje probabiliste është marrëdhënia midis gjatësisë dhe peshës së njerëzve. Është e qartë se njerëzit me pesha të ndryshme mund të kenë të njëjtën gjatësi dhe anasjelltas.

Korrelacioni është një vlerë ndërmjet -1 dhe +1 dhe shënohet me shkronjën r. Për më tepër, nëse vlera është më afër 1, atëherë kjo do të thotë prania e një lidhjeje të fortë, dhe nëse është më afër 0, atëherë një e dobët. Vlera e korrelacionit më e vogël se 0.2 konsiderohet si korrelacion i dobët, më shumë se 0.5 - i lartë. Nëse koeficienti i korrelacionit është negativ, kjo do të thotë se ekziston një lidhje e kundërt: sa më e lartë të jetë vlera e njërës ndryshore, aq më e ulët është vlera e tjetrës.

Në varësi të vlerave të pranuara të koeficientit r, mund të dallohen lloje të ndryshme të korrelacionit:

Korrelacion i fortë pozitiv përcaktohet me vlerën r=1. Termi "i rreptë" do të thotë që vlera e një ndryshoreje përcaktohet në mënyrë unike nga vlerat e një ndryshoreje tjetër, dhe termi " pozitive" - që me rritjen e vlerës së njërës ndryshore rritet edhe vlera e variablit tjetër.

Korrelacioni i rreptë është një abstraksion matematikor dhe pothuajse kurrë nuk ndodh në kërkimin real.

korrelacion pozitiv korrespondon me vlerat 0

Mungesa e korrelacionit përcaktohet me vlerën r=0. Një koeficient korrelacioni prej zero tregon se vlerat e variablave nuk janë të lidhura me njëra-tjetrën në asnjë mënyrë.

Mungesa e korrelacionit H o : 0 r xy =0 formuluar si reflektim i pavlefshëm hipoteza në analizën e korrelacionit.

korrelacion negativ: -1

Korrelacion i fortë negativ përcaktuar me vlerën r= -1. Ai, si një korrelacion i rreptë pozitiv, është një abstraksion dhe nuk gjen shprehje në kërkimin praktik.

Tabela 1

Llojet e korrelacionit dhe përkufizimet e tyre

Metoda e llogaritjes së koeficientit të korrelacionit varet nga lloji i shkallës në të cilën maten vlerat e ndryshores.

Koeficienti i korrelacionit rPearsonështë kryesori dhe mund të përdoret për variabla me shkallë intervali nominale dhe pjesërisht të renditura, shpërndarja e vlerave mbi të cilat korrespondon me normalen (korrelacioni i momenteve të produktit). Koeficienti i korrelacionit Pearson jep rezultate mjaft të sakta edhe në rastet e shpërndarjeve jonormale.

Për shpërndarjet që nuk janë normale, preferohet të përdoren koeficientët e korrelacionit të renditjes Spearman dhe Kendall. Ato renditen sepse programi pararendon variablat e ndërlidhura.

Programi SPSS llogarit korrelacionin r-Spearman si më poshtë: së pari, ndryshoret konvertohen në rang, dhe më pas formula e Pearson-it zbatohet në rang.

Korrelacioni i propozuar nga M. Kendall bazohet në idenë se drejtimi i lidhjes mund të gjykohet duke krahasuar subjektet në çift. Nëse për një palë subjektesh ndryshimi në X përkon në drejtim me ndryshimin në Y përkon, atëherë kjo tregon një marrëdhënie pozitive. Nëse nuk përputhet, atëherë për një marrëdhënie negative. Ky koeficient përdoret kryesisht nga psikologët që punojnë me mostra të vogla. Meqenëse sociologët punojnë me grupe të mëdha të dhënash, është e vështirë të renditen mes çifteve, të identifikojnë ndryshimin në frekuencat relative dhe përmbysjet e të gjitha palëve të subjekteve në kampion. Më i zakonshmi është koeficienti. Pearson.

Meqenëse koeficienti i korrelacionit rPearson është kryesori dhe mund të përdoret (me disa gabime në varësi të llojit të shkallës dhe nivelit të anomalive në shpërndarje) për të gjitha variablat e matur në shkallët sasiore, ne do të shqyrtojmë shembuj të përdorimit të tij dhe do të krahasojmë rezultatet e marra me rezultatet e matjeve duke përdorur koeficientë të tjerë korrelacioni.

Formula për llogaritjen e koeficientit r- Pearson:

r xy = ∑ (Xi-Xav)∙(Yi-Yav) / (N-1)∙σ x ∙σ y ∙

Ku: Xi, Yi- Vlerat e dy variablave;

Xav, Yav - vlerat mesatare të dy variablave;

σ x, σ y janë devijime standarde,

N është numri i vëzhgimeve.

Korrelacionet në çift

Për shembull, ne do të donim të zbulonim se si përgjigjet midis llojeve të ndryshme të vlerave tradicionale lidhen në idetë e studentëve për vendin ideal të punës (variablat: a9.1, a9.3, a9.5, a9.7) , dhe më pas për raportin e vlerave liberale (a9 .2, a9.4, a9.6, a9.8). Këto variabla maten në peshore të renditura me 5 terma.

Përdorim procedurën: "Analizë",  "Korrelacione",  "Në çift". Si parazgjedhje, koeficienti Pearson është vendosur në kutinë e dialogut. Ne përdorim koeficientin Pearson

Variablat e testuar transferohen në dritaren e përzgjedhjes: a9.1, a9.3, a9.5, a9.7

Duke shtypur OK, marrim llogaritjen:

Korrelacionet


a9.1.t. Sa e rëndësishme është të kesh kohë të mjaftueshme për jetën familjare dhe personale?	Korrelacioni Pearson
	Vlera (e dyanshme)

a9.3.t. Sa e rëndësishme është të mos kesh frikë nga humbja e punës?	Korrelacioni Pearson
	Vlera (e dyanshme)

a9.5.t. Sa e rëndësishme është të kesh një shef të tillë që do të konsultohet me ty kur të marrësh këtë apo atë vendim?	Korrelacioni Pearson
	Vlera (e dyanshme)

a9.7.t. Sa e rëndësishme është të punosh në një ekip të mirëkoordinuar, të ndihesh si pjesë e tij?	Korrelacioni Pearson
	Vlera (e dyanshme)

** Korrelacioni është i rëndësishëm në nivelin 0.01 (i dyanshëm).

Tabela e vlerave sasiore të matricës së korrelacionit të ndërtuar

Korrelacione të pjesshme:

Së pari, le të ndërtojmë një korrelacion në çift midis këtyre dy variablave:

Korrelacionet



c8. Ndjehuni pranë atyre që jetojnë pranë jush, fqinjë	Korrelacioni Pearson
	Vlera (e dyanshme)

c12. Ndjehen pranë familjes së tyre	Korrelacioni Pearson
	Vlera (e dyanshme)


**. Korrelacioni është i rëndësishëm në nivelin 0.01 (i dyanshëm).

Më pas përdorim procedurën për ndërtimin e një korrelacioni të pjesshëm: "Analizë",  "Korrelacione",  "Pjesore".

Supozoni se vlera "Është e rëndësishme të përcaktoni në mënyrë të pavarur dhe të ndryshoni rendin e punës suaj" në lidhje me variablat e treguar do të jetë faktori vendimtar, nën ndikimin e të cilit marrëdhënia e identifikuar më parë do të zhduket ose do të rezultojë e vogël. .

Korrelacionet

Variablat e përjashtuar			c8. Ndjehuni pranë atyre që jetojnë pranë jush, fqinjë	c12. Ndjehen pranë familjes së tyre

c16. Ndjehuni pranë njerëzve që kanë të njëjtën pasuri si ju	c8. Ndjehuni pranë atyre që jetojnë pranë jush, fqinjë	Korrelacioni
		Rëndësia (e dyanshme)

	c12. Ndjehen pranë familjes së tyre	Korrelacioni
		Rëndësia (e dyanshme)

Siç shihet nga tabela, nën ndikimin e variablit të kontrollit, marrëdhënia u ul lehtë: nga 0.120 në 0.102. ai mbetet mjaftueshëm i lartë dhe lejon që dikush të hedh poshtë hipotezën zero me zero gabim.

Koeficienti i korrelacionit

Mënyra më e saktë për të përcaktuar ngushtësinë dhe natyrën e korrelacionit është gjetja e koeficientit të korrelacionit. Koeficienti i korrelacionit është një numër i përcaktuar nga formula:

ku r xy është koeficienti i korrelacionit;

x i - vlerat e tiparit të parë;

i - vlerat e veçorisë së dytë;

Mesatarja aritmetike e vlerave të tiparit të parë

Mesatarja aritmetike e vlerave të veçorisë së dytë

Për të përdorur formulën (32), ndërtojmë një tabelë që do të sigurojë sekuencën e nevojshme në përgatitjen e numrave për të gjetur numëruesin dhe emëruesin e koeficientit të korrelacionit.

Siç shihet nga formula (32), sekuenca e veprimeve është si më poshtë: gjejmë mesataret aritmetike të të dy shenjave x dhe y, gjejmë ndryshimin midis vlerave të shenjës dhe mesatares së saj (х i - ) dhe y i - ), pastaj gjejmë produktin e tyre (х i - ) ( y i - ) – shuma e këtij të fundit jep numëruesin e koeficientit të korrelacionit. Për të gjetur emëruesin e tij, duhen katrorë diferencat (x i -) dhe (y i -), të gjenden shumat e tyre dhe të nxjerrim rrënjën katrore nga prodhimi i tyre.

Kështu për shembull 31, gjetja e koeficientit të korrelacionit në përputhje me formulën (32) mund të përfaqësohet si më poshtë (Tabela 50).

Numri që rezulton i koeficientit të korrelacionit bën të mundur përcaktimin e pranisë, afërsisë dhe natyrës së marrëdhënies.

1. Nëse koeficienti i korrelacionit është zero, nuk ka lidhje midis veçorive.

2. Nëse koeficienti i korrelacionit është i barabartë me një, marrëdhënia ndërmjet veçorive është aq e madhe saqë kthehet në funksionale.

3. Vlera absolute e koeficientit të korrelacionit nuk shkon përtej intervalit nga zero në një:

Kjo bën të mundur fokusimin në ngushtësinë e lidhjes: sa më afër zeros të jetë koeficienti, aq më e dobët është lidhja dhe sa më afër unitetit, aq më e afërt është lidhja.

4. Shenja e koeficientit të korrelacionit “plus” do të thotë korrelacion i drejtpërdrejtë, shenja “minus” nënkupton të kundërtën.

Tabela 50

x i	i	(х i - )	(y i - )	(x i - ) (y i - )	(х i - )2	(y i - )2
14,00	12,10	-1,70	-2,30	+3,91	2,89	5,29
14,20	13,80	-1,50	-0,60	+0,90	2,25	0,36
14,90	14,20	-0,80	-0,20	+0,16	0,64	0,04
15,40	13,00	-0,30	-1,40	+0,42	0,09	1,96
16,00	14,60	+0,30	+0,20	+0,06	0,09	0,04
17,20	15,90	+1,50	+2,25	2,25
18,10	17,40	+2,40	+2,00	+4,80	5,76	4,00
109,80	101,00		12,50	13,97	13,94

Kështu, koeficienti i korrelacionit i llogaritur në shembullin 31 është r xy = +0.9. na lejon të nxjerrim përfundimet e mëposhtme: ekziston një korrelacion midis madhësisë së forcës së muskujve të duarve të djathta dhe të majta në nxënësit e studiuar (koeficienti r xy \u003d + 0,9 është jo zero), marrëdhënia është shumë e ngushtë (koeficienti r xy \u003d + 0,9 është afër unitetit), korrelacioni është i drejtpërdrejtë (koeficienti r xy = +0,9 është pozitiv), d.m.th., me një rritje të forcës së muskujve të njërës prej duarve, forca e dorës tjetër rritet.

Gjatë llogaritjes së koeficientit të korrelacionit dhe përdorimit të vetive të tij, duhet të merret parasysh që përfundimet japin rezultate të sakta kur tiparet shpërndahen normalisht dhe kur merret parasysh marrëdhënia midis një numri të madh vlerash të të dy tipareve.

Në shembullin e konsideruar 31, u analizuan vetëm 7 vlera të të dy tipareve, gjë që, natyrisht, nuk mjafton për studime të tilla. Kujtojmë përsëri këtu se shembujt, në këtë libër në përgjithësi dhe në këtë kapitull në veçanti, janë të natyrës së metodave ilustruese dhe jo të një prezantimi të detajuar të ndonjë eksperimenti shkencor. Si rezultat, merren parasysh një numër i vogël i vlerave të veçorive, matjet janë të rrumbullakosura - e gjithë kjo bëhet për të mos errësuar idenë e metodës me llogaritje të rënda.

Vëmendje e veçantë duhet t'i kushtohet thelbit të marrëdhënies në shqyrtim. Koeficienti i korrelacionit nuk mund të çojë në rezultatet e sakta të studimit nëse analiza e marrëdhënies midis veçorive kryhet zyrtarisht. Le të kthehemi te shembulli 31. Të dyja shenjat e konsideruara ishin vlerat e forcës së muskujve të dorës së djathtë dhe të majtë. Le të imagjinojmë se me tiparin x i në shembullin 31 (14.0; 14.2; 14.9... ...18.1) nënkuptojmë gjatësinë e peshkut të kapur rastësisht në centimetra, dhe me tiparin y i (12.1 ; 13.8; 14.2 ... ... 17.4) - pesha e instrumenteve në laborator në kilogramë. Formalisht, duke përdorur aparatin e llogaritjeve për të gjetur koeficientin e korrelacionit dhe në këtë rast duke marrë edhe r xy =+0>9, duhet të kishim konstatuar se ekziston një marrëdhënie e ngushtë e natyrës së drejtpërdrejtë midis gjatësisë së peshkut dhe peshës së instrumentet. Absurditeti i një përfundimi të tillë është i qartë.

Për të shmangur një qasje formale për përdorimin e koeficientit të korrelacionit, duhet përdorur çdo metodë tjetër - matematikore, logjike, eksperimentale, teorike - për të identifikuar mundësinë e një korrelacioni midis shenjave, domethënë për të zbuluar unitetin organik të shenjave. Vetëm atëherë mund të fillohet të përdoret analiza e korrelacionit dhe të përcaktohet madhësia dhe natyra e marrëdhënies.

Në statistikat matematikore ekziston edhe koncepti korrelacion i shumëfishtë- Marrëdhëniet midis tre ose më shumë veçorive. Në këto raste, përdoret një koeficient korrelacioni i shumëfishtë, i përbërë nga koeficientët e korrelacionit në çift të përshkruar më sipër.

Për shembull, koeficienti i korrelacionit të tre shenjave - x і , y і , z і - është:

ku R xyz -koeficienti i korrelacionit të shumëfishtë që shpreh se si tipari x i varet nga tiparet y i dhe z i;

r xy -koeficienti i korrelacionit midis veçorive x i dhe y i ;

r xz - koeficienti i korrelacionit midis veçorive Xi dhe Zi;

r yz - koeficienti i korrelacionit midis veçorive y i, z i

Analiza e korrelacionit është:

Analiza e korrelacionit

Korrelacioni- marrëdhënia statistikore e dy ose më shumë ndryshoreve të rastësishme (ose variablave që mund të konsiderohen si të tillë me një shkallë të pranueshme saktësie). Në të njëjtën kohë, ndryshimet në një ose më shumë nga këto sasi çojnë në një ndryshim sistematik në tjetrin ose në sasi të tjera. Koeficienti i korrelacionit shërben si një masë matematikore e korrelacionit të dy ndryshoreve të rastit.

Korrelacioni mund të jetë pozitiv dhe negativ (është gjithashtu e mundur që të mos ketë marrëdhënie statistikore - për shembull, për variablat e pavarur të rastësishëm). korrelacion negativ - korrelacioni, në të cilin një rritje në një variabël shoqërohet me një rënie në një variabël tjetër, ndërsa koeficienti i korrelacionit është negativ. korrelacion pozitiv - një korrelacion në të cilin një rritje në një variabël shoqërohet me një rritje në një variabël tjetër, ndërsa koeficienti i korrelacionit është pozitiv.

autokorrelacion - marrëdhënie statistikore midis variablave të rastësishëm nga e njëjta seri, por të marra me një zhvendosje, për shembull, për një proces të rastësishëm - me një zhvendosje në kohë.

Metoda e përpunimit të të dhënave statistikore, e cila konsiston në studimin e koeficientëve (korrelacioneve) ndërmjet variablave, quhet analiza e korrelacionit.

Koeficienti i korrelacionit

Koeficienti i korrelacionit ose koeficienti i korrelacionit të çiftit në teorinë e probabilitetit dhe statistikat, ky është një tregues i natyrës së ndryshimit në dy variabla të rastit. Koeficienti i korrelacionit shënohet me shkronjën latine R dhe mund të marrë vlera midis -1 dhe +1. Nëse vlera e modulit është më afër 1, atëherë kjo nënkupton praninë e një lidhjeje të fortë (me një koeficient korrelacioni të barabartë me një, ata flasin për një lidhje funksionale), dhe nëse më afër 0, atëherë një të dobët.

Koeficienti i korrelacionit Pearson

Për sasitë metrike, përdoret koeficienti i korrelacionit Pearson, formula e saktë e të cilit u prezantua nga Francis Galton:

Le X,Y- dy ndryshore të rastësishme të përcaktuara në të njëjtën hapësirë probabiliteti. Pastaj koeficienti i korrelacionit të tyre jepet me formulën:

ku cov është kovarianca dhe D është varianca, ose ekuivalente,

ku simboli tregon pritjen matematikore.

Për të paraqitur grafikisht një marrëdhënie të tillë, mund të përdorni një sistem koordinativ drejtkëndor me boshte që korrespondojnë me të dy variablat. Çdo palë vlerash shënohet me një simbol specifik. Një komplot i tillë quhet "scatterplot".

Metoda e llogaritjes së koeficientit të korrelacionit varet nga lloji i shkallës së cilës i referohen variablat. Pra, për të matur variablat me shkallë intervali dhe sasiore, është e nevojshme të përdoret koeficienti i korrelacionit Pearson (korrelacioni i momenteve të produktit). Nëse të paktën një nga dy variablat ka një shkallë rendore, ose nuk është e shpërndarë normalisht, duhet të përdoret korrelacioni i gradës së Spearman ose τ (tau) i Kendalit. Në rastin kur njëra nga dy variablat është dikotomike, përdoret një korrelacion me dy seri pikësh, dhe nëse të dy variablat janë dikotomikë, përdoret një korrelacion me katër fusha. Llogaritja e koeficientit të korrelacionit ndërmjet dy ndryshoreve jo dikotomike ka kuptim vetëm nëse marrëdhënia ndërmjet tyre është lineare (njëdrejtimshe).

Koeficienti i korrelacionit Kendell

Përdoret për të matur çrregullimin e ndërsjellë.

Koeficienti i korrelacionit të Spearman-it

Vetitë e koeficientit të korrelacionit

Pabarazia Cauchy - Bunyakovsky:

nëse marrim kovariancën si produkt skalar të dy ndryshoreve të rastit, atëherë norma e ndryshores së rastit do të jetë e barabartë me

, dhe pasoja e pabarazisë Cauchy-Bunyakovsky do të jetë: . , ku. Për më tepër, në këtë rast shenjat dhe k ndeshje: .

Analiza e korrelacionit

Analiza e korrelacionit- metoda e përpunimit të të dhënave statistikore, e cila konsiston në studimin e koeficientëve ( korrelacionet) ndërmjet variablave. Në këtë rast, koeficientët e korrelacionit midis një çifti ose çiftesh të shumta karakteristikash krahasohen për të vendosur marrëdhënie statistikore midis tyre.

Synimi analiza e korrelacionit- jepni disa informacione për një variabël me ndihmën e një ndryshoreje tjetër. Në rastet kur është e mundur të arrihet qëllimi, themi se variablat korrelojnë. Në formën e tij më të përgjithshme, miratimi i hipotezës së pranisë së një korrelacioni do të thotë që një ndryshim në vlerën e ndryshores A do të ndodhë njëkohësisht me një ndryshim proporcional në vlerën e B: nëse të dy variablat rriten, atëherë korrelacioni është pozitiv nëse njëra ndryshore rritet dhe tjetra zvogëlohet, korrelacioni është negativ.

Korrelacioni pasqyron vetëm varësinë lineare të sasive, por nuk pasqyron lidhjen funksionale të tyre. Për shembull, nëse llogarisim koeficientin e korrelacionit midis vlerave A = sin(x) dhe B = cos(x), atëherë do të jetë afër zeros, d.m.th., nuk ka varësi midis sasive. Ndërkohë, sasitë A dhe B janë dukshëm të lidhura funksionalisht sipas ligjit sin 2(x) + cos 2(x) = 1.

Kufizimet e analizës së korrelacionit

Vizatimet e shpërndarjeve të çifteve (x,y) me koeficientë korrelacioni x dhe y përkatës për secilën prej tyre. Vini re se koeficienti i korrelacionit pasqyron një marrëdhënie lineare (rreshti i sipërm), por nuk përshkruan një kurbë marrëdhëniesh (rreshti i mesëm) dhe nuk është aspak i përshtatshëm për të përshkruar marrëdhënie komplekse, jolineare (rreshti i poshtëm).

Zbatimi është i mundur nëse ka një numër të mjaftueshëm rastesh për t'u studiuar: për një lloj të caktuar koeficienti korrelacioni, ai varion nga 25 në 100 palë vëzhgimesh.
Kufizimi i dytë rrjedh nga hipoteza e analizës së korrelacionit, e cila përfshin varësia lineare e variablave. Në shumë raste, kur dihet me besueshmëri se ekziston varësia, analiza e korrelacionit mund të mos japë rezultate thjesht sepse varësia është jolineare (e shprehur, për shembull, si parabolë).
Në vetvete, fakti i korrelacionit nuk jep bazë për të pohuar se cili nga variablat i paraprin ose shkakton ndryshime, ose që variablat në përgjithësi janë të lidhura shkakësore me njëri-tjetrin, për shembull, për shkak të veprimit të një faktori të tretë.

Zona e aplikimit

Kjo metodë e përpunimit të të dhënave statistikore është shumë e popullarizuar në shkencat ekonomike dhe sociale (në veçanti, në psikologji dhe sociologji), megjithëse fusha e zbatimit të koeficientëve të korrelacionit është e gjerë: kontrolli i cilësisë së produkteve industriale, metalurgjia, kimia bujqësore, hidrobiologjia, biometria, dhe të tjerët.

Popullariteti i metodës është për shkak të dy pikave: koeficientët e korrelacionit janë relativisht të lehtë për t'u llogaritur, aplikimi i tyre nuk kërkon trajnim të veçantë matematikor. E kombinuar me lehtësinë e interpretimit, lehtësia e aplikimit të koeficientit ka bërë që ai të përdoret gjerësisht në fushën e analizës së të dhënave statistikore.

korrelacion i rremë

Thjeshtësia shpesh joshëse e një studimi korrelacioni e inkurajon studiuesin të nxjerrë përfundime intuitive të rreme në lidhje me praninë e një marrëdhënieje shkakësore midis çifteve të tipareve, ndërsa koeficientët e korrelacionit vendosin vetëm marrëdhënie statistikore.

Në metodologjinë sasiore moderne të shkencave sociale, në fakt, ka pasur një braktisje të përpjekjeve për të vendosur marrëdhënie shkakësore midis variablave të vëzhguar me metoda empirike. Prandaj, kur studiuesit në shkencat sociale flasin për vendosjen e marrëdhënieve midis variablave që studiojnë, nënkuptohet ose një supozim i përgjithshëm teorik ose një varësi statistikore.

Shiko gjithashtu

Funksioni i autokorrelacionit
Funksioni i ndërlidhjes
kovarianca
Koeficienti i përcaktimit
Analiza e regresionit

Fondacioni Wikimedia. 2010.

Karakteristika të ndryshme mund të lidhen.

Ekzistojnë 2 lloje lidhjesh midis tyre:

funksionale;
korrelacioni.

Korrelacioni përkthyer në Rusisht - asgjë më shumë se një lidhje.
Në rastin e një korrelacioni, ekziston një korrespondencë e disa vlerave të një atributi me disa vlera të një atributi tjetër. Si shembuj, ne mund të konsiderojmë korrelacionet e vendosura midis:

gjatësia e putrave, qafës, sqepit te zogjtë si çafkat, vinçat, lejlekët;
treguesit e temperaturës së trupit dhe ritmit të zemrës.

Për shumicën e proceseve biomjekësore, prania e këtij lloji të lidhjes është vërtetuar statistikisht.

Metodat statistikore bëjnë të mundur vërtetimin e faktit të ekzistencës së ndërvarësisë së veçorive. Përdorimi i llogaritjeve speciale për këtë çon në vendosjen e koeficientëve të korrelacionit (masat e lidhjes).

Llogaritjet e tilla quhen analiza e korrelacionit. Ajo kryhet për të konfirmuar varësinë e 2 variablave (ndryshore të rastësishme) nga njëra-tjetra, e cila shprehet me koeficientin e korrelacionit.

Përdorimi i metodës së korrelacionit na lejon të zgjidhim disa probleme:

të identifikojë marrëdhënien ndërmjet parametrave të analizuar;
njohja e pranisë së një korrelacioni lejon zgjidhjen e problemeve të parashikimit. Kështu, ekziston një mundësi reale për të parashikuar sjelljen e një parametri bazuar në analizën e sjelljes së një parametri tjetër të ndërlidhur;
klasifikimi i bazuar në përzgjedhjen e veçorive të pavarura nga njëra-tjetra.

Për variablat:

lidhur me shkallën rendore, llogaritet koeficienti Spearman;
lidhur me shkallën e intervalit - koeficienti Pearson.

Këta janë parametrat më të përdorur, por ka edhe të tjerë.

Vlera e koeficientit mund të shprehet si pozitive ashtu edhe negative.

Në rastin e parë, me një rritje të vlerës së njërës ndryshore, vërehet një rritje në të dytën. Me një koeficient negativ, modeli është i kundërt.

Për çfarë është koeficienti i korrelacionit?

Variablat e rastësishëm të lidhura me njëri-tjetrin mund të kenë një natyrë krejtësisht të ndryshme të kësaj lidhjeje. Nuk do të jetë domosdoshmërisht funksional, rasti kur ka një lidhje të drejtpërdrejtë midis sasive. Më shpesh, të dyja sasitë ndikohen nga një grup i tërë faktorësh të ndryshëm, në rastet kur ato janë të përbashkëta për të dy sasitë, vërehet formimi i modeleve të lidhura.

Kjo do të thotë se fakti i vërtetuar statistikisht i ekzistencës së një marrëdhënieje midis sasive nuk është një konfirmim se shkaku i ndryshimeve të vëzhguara është vërtetuar. Si rregull, studiuesi arrin në përfundimin se ekzistojnë dy pasoja të ndërlidhura.

Vetitë e koeficientit të korrelacionit

Kjo statistikë ka këto karakteristika:

vlera e koeficientit varion nga -1 në +1. Sa më afër vlerave ekstreme, aq më e fortë është marrëdhënia pozitive ose negative midis parametrave linearë. Në rastin e një vlere zero, flasim për mungesën e korrelacionit midis veçorive;
një vlerë pozitive e koeficientit tregon se në rastin e rritjes së vlerës së një atributi, vërehet një rritje në të dytin (korrelacion pozitiv);
vlera negative - në rastin e rritjes së vlerës së një atributi, vërehet një rënie në të dytin (korrelacion negativ);
afrimi i vlerës së treguesit në pikat ekstreme (ose -1 ose +1) tregon praninë e një marrëdhënieje shumë të fortë lineare;
treguesit e tipareve mund të ndryshojnë me një vlerë konstante të koeficientit;
koeficienti i korrelacionit është një sasi pa dimension;
prania e një korrelacioni nuk është një konfirmim i detyrueshëm i një marrëdhënieje shkakësore.

Vlerat e koeficientit të korrelacionit

Forca e korrelacionit mund të karakterizohet duke përdorur shkallën Cheldok, në të cilën një karakteristikë cilësore korrespondon me një vlerë të caktuar numerike.

Në rast të korrelacionit pozitiv në vlerë:

0-0,3 - korrelacioni është shumë i dobët;
0,3-0,5 - i dobët;
0,5-0,7 - forca mesatare;
0,7-0,9 - e lartë;
0,9-1 - forca shumë e lartë e korrelacionit.

Shkalla mund të përdoret gjithashtu për korrelacion negativ. Në këtë rast, karakteristikat cilësore zëvendësohen nga ato të kundërta.

Ju mund të përdorni shkallën e thjeshtuar Cheldok, në të cilën dallohen vetëm 3 shkallëzime të fuqisë së korrelacionit:

shumë të fortë - tregues ± 0,7 - ± 1;
mesatare - tregues ± 0,3 - ± 0,699;
shumë i dobët - tregues 0 - ± 0,299.

Ky tregues statistikor lejon jo vetëm të testojë supozimin e ekzistencës së një marrëdhënie lineare midis veçorive, por edhe të vendosë forcën e tij.

Llojet e koeficientit të korrelacionit

Koeficientët e korrelacionit mund të klasifikohen sipas shenjës dhe vlerës:

pozitive;
i pavlefshëm;
negativ.

Në varësi të vlerave të analizuara, koeficienti llogaritet:

Pearson;
Shtizëtar;
Kendala;
Shenjat Fechner;
përputhshmëria ose korrelacioni i renditjes së shumëfishtë.

Koeficienti i korrelacionit Pearson përdoret për të vendosur lidhje të drejtpërdrejta midis vlerave absolute të variablave. Në këtë rast, shpërndarjet e të dy serive të variablave duhet t'i afrohen normales. Variablat që krahasohen duhet të ndryshojnë nga i njëjti numër karakteristikash të ndryshme. Shkalla që përfaqëson variablat duhet të jetë ose një shkallë intervali ose një shkallë raporti.

vendosja e saktë e fuqisë së korrelacionit;
krahasimi i karakteristikave sasiore.

Ka disa disavantazhe të përdorimit të koeficientit linear të korrelacionit të Pearson:

metoda është e paqëndrueshme në rastin e vlerave numerike të jashtme;
Duke përdorur këtë metodë, është e mundur të përcaktohet forca e korrelacionit vetëm për një marrëdhënie lineare; për llojet e tjera të marrëdhënieve të ndërsjella të variablave, duhet të përdoren metoda të analizës së regresionit.

Korrelacioni i renditjes përcaktohet me metodën Spearman, e cila bën të mundur studimin statistikor të marrëdhënies midis fenomeneve. Falë këtij koeficienti, llogaritet shkalla aktuale e paralelizmit të dy serive të tipareve të shprehura në mënyrë sasiore, si dhe vlerësohet afërsia e marrëdhënies së identifikuar.

nuk kërkon një përkufizim të saktë të vlerës së fuqisë së korrelacionit;
treguesit e krahasuar kanë vlera sasiore dhe atributive;
krahasimi i rreshtave të veçorive me variantet e hapura të vlerave.

Metoda e Spearman i referohet metodave të analizës joparametrike, kështu që nuk ka nevojë të kontrollohet normaliteti i shpërndarjes së veçorive. Përveç kësaj, ju lejon të krahasoni treguesit e shprehur në shkallë të ndryshme. Për shembull, krahasimi i vlerave të numrit të qelizave të kuqe të gjakut në një vëllim të caktuar gjaku (shkallë e vazhdueshme) dhe vlerësimi i ekspertit, i shprehur në pikë (shkalla rendore).

Efikasiteti i metodës ndikohet negativisht nga një ndryshim i madh midis vlerave të vlerave të krahasuara. Metoda është gjithashtu joefektive në rastet kur vlera e matur karakterizohet nga një shpërndarje e pabarabartë e vlerave.

Llogaritja hap pas hapi e koeficientit të korrelacionit në Excel

Llogaritja e koeficientit të korrelacionit përfshin ekzekutimin sekuencial të një numri operacionesh matematikore.

Formula e mësipërme për llogaritjen e koeficientit Pearson tregon se sa i mundimshëm është ky proces nëse bëhet me dorë.
Përdorimi i aftësive të Excell përshpejton procesin e gjetjes së koeficientit herë pas here.

Mjafton të ndiqni një algoritëm të thjeshtë veprimesh:

futja e informacionit bazë - një kolonë me vlera x dhe një kolonë me vlera y;
në vegla, zgjidhet dhe hapet skeda Formula;
në skedën që hapet, zgjidhni "Fut funksionin fx";
në kutinë e dialogut që hapet, zgjidhet funksioni statistikor "Correl", i cili ju lejon të llogaritni koeficientin e korrelacionit midis 2 grupeve të të dhënave;
të dhënat futen në dritaren që hapet: grupi 1 - diapazoni i vlerave të kolonës x (të dhënat duhet të zgjidhen), grupi 2 - diapazoni i vlerave të kolonës y;
shtypet tasti "OK", rezultati i llogaritjes së koeficientit shfaqet në rreshtin "vlera";
përfundim në lidhje me praninë e një korrelacioni midis 2 grupeve të të dhënave dhe fuqisë së tij.

Një model korrelacioni (CM) është një program llogaritjeje që ofron një ekuacion matematik në të cilin treguesi që rezulton matet në varësi të një ose më shumë treguesve.

yx \u003d ao + a1x1

ku: y - treguesi i performancës, në varësi të faktorit x;

x - shenja e faktorit;

a1 - parametri KM, që tregon se sa do të ndryshojë treguesi efektiv y kur faktori x ndryshon me një, nëse në të njëjtën kohë të gjithë faktorët e tjerë që ndikojnë në y mbeten të pandryshuar;

ao - parametri KM, i cili tregon ndikimin e të gjithë faktorëve të tjerë në treguesin efektiv y, përveç shenjës së faktorit x.

Kur zgjidhni treguesit efektivë dhe faktorë të modelit, është e nevojshme të merret parasysh fakti që treguesi efektiv në zinxhirin e marrëdhënieve shkak-pasojë është në një nivel më të lartë se treguesit e faktorëve.

Karakteristikat e modelit të korrelacionit

Pas llogaritjes së parametrave të modelit të korrelacionit, llogaritet koeficienti i korrelacionit.

p - koeficienti i korrelacionit të çiftit, -1 ≤ p ≤ 1, tregon forcën dhe drejtimin e ndikimit të treguesit të faktorit në atë efektiv. Sa më afër 1, aq më e fortë është marrëdhënia, aq më afër 0, aq më e dobët është marrëdhënia. Nëse koeficienti i korrelacionit është pozitiv, atëherë lidhja është e drejtpërdrejtë, nëse është negative, është e anasjelltë.

Formula e koeficientit të korrelacionit: pxy \u003d (xy-x * 1 / y) / eh * eu

ex=xx2-(x)2; eu=y2-(y)2

Nëse CM është shumëfaktorial linear, që ka formën:

yx \u003d ao + a1x1 + a2x2 + ... + axp

atëherë për të llogaritet një koeficient korrelacioni i shumëfishtë.

0 ≤ Р ≤ 1 dhe tregon fuqinë e ndikimit të të gjithë treguesve të faktorëve të marrë së bashku në atë efektiv.

P \u003d 1- ((uh-uy) 2 / (yi - usr) 2)

Ku: uh - tregues efektiv - vlera e llogaritur;

ui - vlera aktuale;

usr - vlera aktuale, mesatare.

Vlera e llogaritur yx merret si rezultat i zëvendësimit në modelin e korrelacionit në vend të x1, x2, etj. vlerat e tyre reale.

Për modelet jolineare me një faktor dhe me shumë faktorë, raporti i korrelacionit llogaritet:

1 ≤ m ≤ 1;

Besohet se lidhja midis treguesve efektivë dhe faktorëve të përfshirë në model është e dobët nëse vlera e koeficientit të afërsisë së lidhjes (m) është brenda 0-0,3; nëse 0,3-0,7 - ngushtësia e lidhjes është mesatare; mbi 0.7-1 - lidhja është e fortë.

Meqenëse koeficienti i korrelacionit (i çiftuar) p, koeficienti i korrelacionit (i shumëfishtë) P, raporti i korrelacionit m janë vlera probabiliste, atëherë për to llogariten koeficientët e rëndësisë së tyre (të përcaktuara nga tabelat). Nëse këta koeficientë janë më të mëdhenj se vlera e tyre tabelare, atëherë koeficientët e afërsisë së lidhjes janë arsye të rëndësishme. Nëse koeficientët e rëndësisë së ngushtësisë së lidhjes janë më të vogla se vlerat tabelare, ose nëse vetë koeficienti i lidhjes është më i vogël se 0.7, atëherë jo të gjithë treguesit e faktorëve që ndikojnë ndjeshëm në rezultat përfshihen në model.

Koeficienti i përcaktimit tregon qartë përqindjen e treguesve të faktorëve të përfshirë në model që përcaktojnë formimin e rezultatit.

Nëse koeficienti i përcaktimit është më i madh se 50, atëherë modeli përshkruan në mënyrë adekuate procesin në studim, nëse është më pak se 50, atëherë është e nevojshme të ktheheni në fazën e parë të ndërtimit dhe të rishikoni përzgjedhjen e treguesve të faktorëve për përfshirje në model.

Koeficienti i Fisher ose kriteri i Fisher karakterizon efektivitetin e modelit në tërësi. Nëse vlera e llogaritur e koeficientit tejkalon vlerën e tabelës, atëherë modeli i ndërtuar është i përshtatshëm për analizë, si dhe tregues planifikimi, llogaritje për të ardhmen. Vlera e përafërt tabelare \u003d 1.5. Nëse vlera e llogaritur është më e vogël se vlera e tabelës, është e nevojshme që fillimisht të ndërtohet modeli, duke përfshirë faktorët që ndikojnë ndjeshëm në rezultat. Përveç efektivitetit të modelit në tërësi, çdo koeficient regresioni ndikon në materialitetin. Nëse vlera e llogaritur e këtij koeficienti e ka tejkaluar vlerën tabelare, atëherë koeficienti i regresionit do të jetë i rëndësishëm, nëse është më i vogël, atëherë treguesi i faktorit për të cilin llogaritet ky koeficient hiqet nga kampioni, llogaritjet fillojnë nga e para, por pa këtë faktor. .

Koeficienti i korrelacionit është shkalla e lidhjes midis dy variablave. Llogaritja e tij jep një ide nëse ekziston një marrëdhënie midis dy grupeve të të dhënave. Ndryshe nga regresioni, korrelacioni nuk lejon parashikimin e vlerave. Megjithatë, llogaritja e koeficientit është një hap i rëndësishëm në analizën paraprake statistikore. Për shembull, kemi gjetur se koeficienti i korrelacionit ndërmjet nivelit të investimeve të huaja direkte dhe rritjes së PBB-së është i lartë. Kjo na jep një ide se për të siguruar prosperitet, është e nevojshme të krijohet një klimë e favorshme veçanërisht për sipërmarrësit e huaj. Një përfundim jo aq i qartë në shikim të parë!

Korrelacioni dhe shkakësia

Ndoshta nuk ka asnjë fushë të vetme statistikash që do të vendosej kaq fort në jetën tonë. Koeficienti i korrelacionit përdoret në të gjitha fushat e njohurive publike. Rreziku i tij kryesor qëndron në faktin se shpeshherë spekulohen vlerat e larta të tij për të bindur njerëzit dhe për t'i bërë ata të besojnë në disa përfundime. Megjithatë, në fakt, një korrelacion i fortë nuk tregon aspak një lidhje shkakësore midis sasive.

Koeficienti i korrelacionit: formula e Pearson dhe Spearman

Ekzistojnë disa tregues kryesorë që karakterizojnë marrëdhënien midis dy variablave. Historikisht, i pari është koeficienti i korrelacionit linear i Pearson. Kalohet në shkollë. Ajo u zhvillua nga K. Pearson dhe J. Yule bazuar në veprën e Fr. Galton. Ky koeficient ju lejon të shihni marrëdhënien midis numrave racionalë që ndryshojnë në mënyrë racionale. Është gjithmonë më i madh se -1 dhe më i vogël se 1. Një numër negativ tregon një marrëdhënie në përpjesëtim të zhdrejtë. Nëse koeficienti është zero, atëherë nuk ka lidhje midis variablave. E barabartë me një numër pozitiv - ekziston një lidhje drejtpërdrejt proporcionale midis sasive të studiuara. Koeficienti i korrelacionit të rangut të Spearman bën të mundur thjeshtimin e llogaritjeve duke ndërtuar një hierarki vlerash të ndryshueshme.

Marrëdhëniet ndërmjet variablave

Korrelacioni ndihmon për t'iu përgjigjur dy pyetjeve. Së pari, nëse marrëdhënia ndërmjet variablave është pozitive apo negative. Së dyti, sa e fortë është varësia. Analiza e korrelacionit është një mjet i fuqishëm me të cilin mund të merret ky informacion i rëndësishëm. Është e lehtë të shihet se të ardhurat dhe shpenzimet e familjeve rriten dhe bien proporcionalisht. Një marrëdhënie e tillë konsiderohet pozitive. Përkundrazi, kur çmimi i një produkti rritet, kërkesa për të bie. Një marrëdhënie e tillë quhet negative. Vlerat e koeficientit të korrelacionit janë midis -1 dhe 1. Zero do të thotë se nuk ka asnjë lidhje midis vlerave të studiuara. Sa më afër treguesit me vlerat ekstreme, aq më e fortë është marrëdhënia (negative ose pozitive). Mungesa e varësisë evidentohet nga një koeficient nga -0.1 në 0.1. Duhet të kuptohet se një vlerë e tillë tregon vetëm mungesën e një marrëdhënieje lineare.

Karakteristikat e aplikimit

Përdorimi i të dy treguesve është subjekt i supozimeve të caktuara. Së pari, prania e një marrëdhënieje të fortë nuk përcakton faktin që një vlerë përcakton tjetrën. Mund të ketë një sasi të tretë që përcakton secilën prej tyre. Së dyti, një koeficient i lartë korrelacioni Pearson nuk tregon një lidhje shkakësore midis variablave të studiuar. Së treti, tregon një marrëdhënie ekskluzivisht lineare. Korrelacioni mund të përdoret për të vlerësuar të dhënat sasiore domethënëse (p.sh. presioni barometrik, temperatura e ajrit) dhe jo kategori të tilla si gjinia ose ngjyra e preferuar.

Koeficienti i korrelacionit të shumëfishtë

Pearson dhe Spearman hetuan lidhjen midis dy variablave. Por çfarë të bëni nëse ka tre ose edhe më shumë prej tyre. Këtu hyn koeficienti i korrelacionit të shumëfishtë. Për shembull, produkti kombëtar bruto ndikohet jo vetëm nga investimet e huaja direkte, por edhe nga politikat monetare dhe fiskale të shtetit, si dhe nga niveli i eksporteve. Shkalla e rritjes dhe vëllimi i PBB-së janë rezultat i ndërveprimit të një sërë faktorësh. Megjithatë, duhet kuptuar se modeli i korrelacionit të shumëfishtë bazohet në një numër thjeshtimesh dhe supozimesh. Së pari, multikolineariteti ndërmjet sasive është i përjashtuar. Së dyti, marrëdhënia ndërmjet ndryshores së varur dhe variablave që ndikojnë në të supozohet të jetë lineare.

Fushat e përdorimit të analizës së korrelacionit dhe regresionit

Kjo metodë për të gjetur lidhjen midis sasive përdoret gjerësisht në statistika. Më shpesh përdoret në tre raste kryesore:

Për testimin e marrëdhënieve shkakësore midis vlerave të dy variablave. Si rezultat, studiuesi shpreson të gjejë një marrëdhënie lineare dhe të nxjerrë një formulë që përshkruan këto marrëdhënie midis sasive. Njësitë e tyre matëse mund të jenë të ndryshme.
Për të kontrolluar për një marrëdhënie midis vlerave. Në këtë rast, askush nuk përcakton se cila variabël është e varur. Mund të rezultojë se vlera e të dy sasive përcakton një faktor tjetër.
Për të nxjerrë një ekuacion. Në këtë rast, thjesht mund të zëvendësoni numrat në të dhe të zbuloni vlerat e ndryshores së panjohur.

Një burrë në kërkim të një marrëdhënieje shkakësore

Vetëdija është e rregulluar në atë mënyrë që ne duhet patjetër të shpjegojmë ngjarjet që ndodhin përreth. Një person është gjithmonë në kërkim të një lidhjeje midis figurës së botës në të cilën jeton dhe informacionit që merr. Shpesh truri krijon rend nga kaosi. Ai mund të shohë lehtësisht një marrëdhënie shkakësore ku nuk ka asnjë. Shkencëtarët duhet të mësojnë në mënyrë specifike për të kapërcyer këtë prirje. Aftësia për të vlerësuar marrëdhëniet midis të dhënave është objektivisht thelbësore në një karrierë akademike.

Paragjykimi mediatik

Konsideroni se si prania e një korrelacioni mund të keqinterpretohet. Një grup studentësh britanikë me sjellje të keqe u pyetën nëse prindërit e tyre pinin duhan. Pastaj testi u botua në gazetë. Rezultati tregoi një korrelacion të fortë midis pirjes së duhanit të prindërve dhe delikuencës së fëmijëve të tyre. Profesori që kreu këtë studim sugjeroi edhe vendosjen e një paralajmërimi për këtë në paketat e cigareve. Megjithatë, ka një sërë problemesh me këtë përfundim. Së pari, korrelacioni nuk tregon se cila nga sasitë është e pavarur. Prandaj, është mjaft e mundur të supozohet se zakoni i dëmshëm i prindërve është shkaktuar nga mosbindja e fëmijëve. Së dyti, është e pamundur të thuhet me siguri se të dyja problemet nuk kanë lindur për shkak të ndonjë faktori të tretë. Për shembull, familjet me të ardhura të ulëta. Duhet theksuar aspekti emocional i konkluzioneve fillestare të profesorit që kreu studimin. Ai ishte një kundërshtar i flaktë i pirjes së duhanit. Prandaj, nuk është për t'u habitur që ai i interpretoi rezultatet e studimit të tij në këtë mënyrë.

konkluzionet

Keqinterpretimi i korrelacionit si një marrëdhënie shkakësore midis dy variablave mund të çojë në gabime të turpshme kërkimore. Problemi është se ajo qëndron në thelbin e vetëdijes njerëzore. Shumë truke marketingu bazohen në këtë veçori. Kuptimi i ndryshimit midis shkakësisë dhe korrelacionit ju lejon të analizoni në mënyrë racionale informacionin si në jetën e përditshme ashtu edhe në karrierën tuaj profesionale.

Po ngarkohet...

Ndaje me miqte:

Shtoni këtë artikull në të preferuarat tuaja për të mos humbur!

Çfarë është korrelacioni në statistika. Koeficienti i korrelacionit është një karakteristikë e modelit të korrelacionit. Si të interpretohet vlera e koeficientit të korrelacionit Pearson

Statistikat dhe përpunimi i të dhënave në psikologji (vazhdim)

Analiza e korrelacionit

Koeficienti i korrelacionit

/ SPSS 10

Koeficienti i korrelacionit

Analiza e korrelacionit është:

Koeficienti i korrelacionit

Koeficienti i korrelacionit Pearson

Koeficienti i korrelacionit Kendell

Koeficienti i korrelacionit të Spearman-it

Vetitë e koeficientit të korrelacionit

Analiza e korrelacionit

Kufizimet e analizës së korrelacionit

Zona e aplikimit

korrelacion i rremë

Shiko gjithashtu

Për çfarë është koeficienti i korrelacionit?

Vetitë e koeficientit të korrelacionit

Vlerat e koeficientit të korrelacionit

Llojet e koeficientit të korrelacionit

Llogaritja hap pas hapi e koeficientit të korrelacionit në Excel

Korrelacioni dhe shkakësia

Koeficienti i korrelacionit: formula e Pearson dhe Spearman

Marrëdhëniet ndërmjet variablave

Karakteristikat e aplikimit

Koeficienti i korrelacionit të shumëfishtë

Fushat e përdorimit të analizës së korrelacionit dhe regresionit

Një burrë në kërkim të një marrëdhënieje shkakësore

Paragjykimi mediatik

konkluzionet

Statistikat dhe përpunimi i të dhënave në psikologji
(vazhdim)