Kas ir korelācija statistikā. Korelācijas koeficients ir korelācijas modeļa īpašība. Kā interpretēt Pīrsona korelācijas koeficienta vērtību
![Kas ir korelācija statistikā. Korelācijas koeficients ir korelācijas modeļa īpašība. Kā interpretēt Pīrsona korelācijas koeficienta vērtību](https://i2.wp.com/psyfactor.org/lib/i/Image45.gif)
» Statistika
Statistika un datu apstrāde psiholoģijā
(turpinājums)
Korelācijas analīze
Studējot korelācijas mēģiniet noteikt, vai ir kāda saistība starp diviem rādītājiem vienā un tajā pašā izlasē (piemēram, starp bērnu augumu un svaru vai starp līmeni IQ un skolas sasniegumi) vai starp diviem dažādiem paraugiem (piemēram, salīdzinot dvīņu pārus), un, ja šī sakarība pastāv, vai viena rādītāja palielināšanos pavada rādītāja pieaugums (pozitīva korelācija) vai samazinājums (negatīva korelācija). cits.
Citiem vārdiem sakot, korelācijas analīze palīdz noteikt, vai ir iespējams paredzēt viena rādītāja iespējamās vērtības, zinot cita vērtību.
Līdz šim, analizējot savas pieredzes rezultātus marihuānas ietekmes pētījumos, mēs apzināti esam ignorējuši tādu rādītāju kā reakcijas laiks. Tikmēr būtu interesanti pārbaudīt, vai pastāv saistība starp reakciju efektivitāti un to ātrumu. Tas ļautu, piemēram, argumentēt, ka jo lēnāks cilvēks, jo precīzāka un efektīvāka būs viņa rīcība un otrādi.
Šim nolūkam var izmantot divas dažādas metodes: Bravai-Pīrsona koeficienta (r) aprēķināšanas parametrisko metodi un Spīrmena ranga korelācijas koeficienta (r s) aprēķinu, ko piemēro kārtas datiem, t.i. ir neparametrisks. Tomēr vispirms sapratīsim, kas ir korelācijas koeficients.
Korelācijas koeficients
Korelācijas koeficients ir vērtība, kas var mainīties no +1 līdz -1. Pilnīgas pozitīvas korelācijas gadījumā šis koeficients ir vienāds ar plus 1, bet pilnīgas negatīvas korelācijas gadījumā tas ir mīnus 1. Grafikā tas atbilst taisnei, kas iet cauri korelācijas krustošanās punktiem. katra datu pāra vērtības:
Ja šie punkti nesakrīt taisnā līnijā, bet veido “mākoni”, korelācijas koeficienta absolūtā vērtība kļūst mazāka par vienu un tuvojas nullei, mākoņam noapaļojot:
Ja korelācijas koeficients ir 0, abi mainīgie ir pilnīgi neatkarīgi viens no otra.
Humanitārajās zinātnēs korelācija tiek uzskatīta par spēcīgu, ja tās koeficients ir lielāks par 0,60; ja tas pārsniedz 0,90, tad korelācija tiek uzskatīta par ļoti spēcīgu. Taču, lai varētu izdarīt secinājumus par sakarībām starp mainīgajiem, liela nozīme ir izlases lielumam: jo lielāka izlase, jo ticamāka ir iegūtā korelācijas koeficienta vērtība. Ir tabulas ar Bravai-Pīrsona un Spīrmena korelācijas koeficientu kritiskajām vērtībām dažādam brīvības pakāpju skaitam (tas ir vienāds ar pāru skaitu mīnus 2, t.i. n- 2). Tikai tad, ja korelācijas koeficienti ir lielāki par šīm kritiskajām vērtībām, tos var uzskatīt par ticamiem. Tātad, lai korelācijas koeficients 0,70 būtu ticams, analīzē ir jāņem vismaz 8 datu pāri ( h =n-2=6), aprēķinot r (sk. 4. tabulu pielikumā) un 7 datu pārus (h = n-2= 5) aprēķinot r s (5. tabula pielikumā).
Es vēlreiz gribu uzsvērt, ka šo divu koeficientu būtība ir nedaudz atšķirīga. Negatīvs koeficients r norāda, ka efektivitāte visbiežāk ir lielāka, jo ātrāks reakcijas laiks, savukārt, aprēķinot koeficientu r s, bija jāpārbauda, vai ātrāki subjekti vienmēr reaģē precīzāk, bet lēnāki mazāk precīzi.
Bravai-Pīrsona korelācijas koeficients (r) - Šis ir parametrisks rādītājs, kura aprēķināšanai tiek salīdzinātas divu mērījumu rezultātu vidējās un standartnovirzes. Šajā gadījumā tiek izmantota formula (dažādiem autoriem tā var izskatīties atšķirīgi)
kur Σ XY- katra pāra datu reizinājumu summa;
n ir pāru skaits;
X - vidējais dotajam mainīgajam x;
Y -
vidējais mainīgajiem datiem Y
Sx- sadalījuma standarta novirze X;
Sy- sadalījuma standarta novirze plkst
Spīrmena ranga korelācijas koeficients ( rs ) - tas ir neparametrisks rādītājs, ar kura palīdzību viņi mēģina atklāt attiecības starp atbilstošo lielumu rindām divās mērījumu sērijās.
Šo koeficientu ir vieglāk aprēķināt, taču rezultāti ir mazāk precīzi nekā izmantojot r. Tas ir saistīts ar faktu, ka, aprēķinot Spīrmena koeficientu, tiek izmantota datu secība, nevis to kvantitatīvās īpašības un intervāli starp klasēm.
Fakts ir tāds, ka, izmantojot Spīrmena rangu korelācijas koeficientu (r s), viņi tikai pārbauda, vai datu ranžējums jebkuram paraugam būs tāds pats kā virknē citu datu par šo paraugu, kas ir saistīti ar pirmo (piemēram, , vai viņi būs vienādi "ranžēti" studentiem gan psiholoģijā, gan matemātikā vai pat ar diviem dažādiem psiholoģijas skolotājiem?). Ja koeficients ir tuvu +1, tad tas nozīmē, ka abas sērijas praktiski sakrīt, un, ja šis koeficients ir tuvu -1, var runāt par pilnīgu apgrieztu sakarību.
Koeficients rs aprēķina pēc formulas
kur d ir atšķirība starp konjugēto pazīmju vērtību rindām (neatkarīgi no tās zīmes) un ir pāru skaits.
Parasti šo neparametrisko testu izmanto gadījumos, kad jums ir jāizdara daži secinājumi ne tik daudz intervāli starp datiem, cik daudz par tiem ierindojas, un arī tad, ja sadalījuma līknes ir pārāk šķības un neļauj izmantot parametriskus kritērijus, piemēram, koeficientu r (šajos gadījumos var būt nepieciešams pārvērst kvantitatīvos datus kārtas datos).
Kopsavilkums
Tātad, mēs esam apsvēruši dažādas parametriskas un neparametriskas statistikas metodes, ko izmanto psiholoģijā. Mūsu apskats bija ļoti virspusējs, un tā galvenais uzdevums bija likt lasītājam saprast, ka statistika nav tik biedējoša, kā šķiet, un pārsvarā prasa veselo saprātu. Atgādinām, ka "pieredzes" dati, ar kuriem mēs šeit esam nodarbojušies, ir fiktīvi un nevar kalpot par pamatu nekādiem secinājumiem. Tomēr šādu eksperimentu būtu vērts veikt. Tā kā šim eksperimentam tika izvēlēta tīri klasiska tehnika, to pašu statistisko analīzi varēja izmantot daudzos dažādos eksperimentos. Jebkurā gadījumā mums šķiet, ka esam iezīmējuši dažus galvenos virzienus, kas var būt noderīgi tiem, kuri nezina, ar ko sākt rezultātu statistisko analīzi.
Literatūra
- Godefrojs Dž. Kas ir psiholoģija. - M., 1992. gads.
- Četiljons G., 1977. Statistique en Sciences humaines, Trois-Rivieres, Ed. SMG.
- Gilberts N. 1978. Statistiques, Monreāla, Ed. H.R.W.
- Moronijs M.J., 1970. Comprendre la statistique, Verviers, Gerard et Cie.
- Zīgels S., 1956. Neparametriskā statistika, Ņujorka, MacGraw-Hill Book Co.
Izklājlapu lietojumprogramma
Piezīmes. 1) Par lieliem paraugiem vai nozīmīguma līmeņiem, kas mazāki par 0,05, skatiet tabulas statistikas mācību grāmatās.
2) Vērtību tabulas citiem neparametriskiem kritērijiem var atrast īpašās vadlīnijās (skatīt bibliogrāfiju).
1. tabula. Kritēriju vērtības t Students | |
h | 0,05 |
1 | 6,31 |
2 | 2,92 |
3 | 2,35 |
4 | 2,13 |
5 | 2,02 |
6 | 1,94 |
7 | 1,90 |
8 | 1,86 |
9 | 1,83 |
10 | 1,81 |
11 | 1,80 |
12 | 1,78 |
13 | 1,77 |
14 | 1,76 |
15 | 1,75 |
16 | 1,75 |
17 | 1,74 |
18 | 1,73 |
19 | 1,73 |
20 | 1,73 |
21 | 1,72 |
22 | 1,72 |
23 | 1,71 |
24 | 1,71 |
25 | 1,71 |
26 | 1,71 |
27 | 1,70 |
28 | 1,70 |
29 | 1,70 |
30 | 1,70 |
40 | 1,68 |
¥ | 1,65 |
2. tabula. Kritērija χ 2 vērtības | |
h | 0,05 |
1 | 3,84 |
2 | 5,99 |
3 | 7,81 |
4 | 9,49 |
5 | 11,1 |
6 | 12,6 |
7 | 14,1 |
8 | 15,5 |
9 | 16,9 |
10 | 18,3 |
3. tabula. Uzticamas Z vērtības | |
R | Z |
0,05 | 1,64 |
0,01 | 2,33 |
4. tabula. R ticamas (kritiskās) vērtības | ||
h = (N-2) | p= 0,05 (5%) | |
3 | 0,88 | |
4 | 0,81 | |
5 | 0,75 | |
6 | 0,71 | |
7 | 0,67 | |
8 | 0,63 | |
9 | 0,60 | |
10 | 0,58 | |
11 | 0.55 | |
12 | 0,53 | |
13 | 0,51 | |
14 | 0,50 | |
15 | 0,48 | |
16 | 0,47 | |
17 | 0,46 | |
18 | 0,44 | |
19 | 0,43 | |
20 | 0,42 |
5. tabula. R s ticamās (kritiskās) vērtības | |
h = (N-2) | p = 0,05 |
2 | 1,000 |
3 | 0,900 |
4 | 0,829 |
5 | 0,714 |
6 | 0,643 |
7 | 0,600 |
8 | 0,564 |
10 | 0,506 |
12 | 0,456 |
14 | 0,425 |
16 | 0,399 |
18 | 0,377 |
20 | 0,359 |
22 | 0,343 |
24 | 0,329 |
26 | 0,317 |
28 | 0,306 |
Korelācijas koeficients ir vērtība, kas var mainīties no +1 līdz -1. Pilnīgas pozitīvas korelācijas gadījumā šis koeficients ir vienāds ar plus 1 (viņi saka, ka, palielinoties viena mainīgā vērtībai, palielinās cita mainīgā vērtība), un ar pilnīgu negatīvu korelāciju - mīnus 1 (norāda atgriezenisko saiti , t.i., kad viena mainīgā vērtības palielinās, otra vērtības samazinās).
1. piemērs:
Kautrības un depresijas atkarības grafiks. Kā redzams, punkti (subjekti) neatrodas nejauši, bet rindojas ap vienu līniju, un, skatoties uz šo līniju, var teikt, jo augstāks kautrīgums izpaužas cilvēkā, jo depresīvāks, t.i., šīs parādības. ir savstarpēji saistīti.
2. piemērs: kautrības un sabiedriskuma grafiks. Mēs redzam, ka, pieaugot kautrībai, sabiedriskums samazinās. To korelācijas koeficients ir -0,43. Tādējādi korelācijas koeficients, kas lielāks no 0 līdz 1, norāda uz tieši proporcionālu sakarību (jo vairāk ... jo vairāk ...), un koeficients no -1 līdz 0 norāda uz apgriezti proporcionālu sakarību (jo vairāk ... jo mazāk . ..)
Ja korelācijas koeficients ir 0, abi mainīgie ir pilnīgi neatkarīgi viens no otra.
korelācija- šīs ir attiecības, kur atsevišķu faktoru ietekme parādās tikai kā tendence (vidēji) ar faktisko datu masveida novērošanu. Korelācijas atkarības piemēri var būt atkarība starp bankas aktīvu lielumu un bankas peļņas apmēru, darba ražīguma pieaugumu un darbinieku darba stāžu.
Tiek izmantotas divas korelāciju klasifikācijas sistēmas pēc to stipruma: vispārējā un īpašā.
Vispārējā korelāciju klasifikācija: 1) spēcīga vai tuvu ar korelācijas koeficientu r> 0,70; 2) vidēja pie 0,500,70, nevis tikai augsta nozīmības līmeņa korelācija.Nākamajā tabulā ir norādīti dažādu veidu skalu korelācijas koeficientu nosaukumi.
Dihotomiskā skala (1/0) | Ranga (kārtas) skala | ||
Dihotomiskā skala (1/0) | Pīrsona asociācijas koeficients, Pīrsona četršūnu konjugācijas koeficients. | Bisēriskā korelācija | |
Ranga (kārtas) skala | Ranga-biserialu korelācija. | Spīrmena vai Kendala ranga korelācijas koeficients. | |
Intervāls un absolūtā skala | Bisēriskā korelācija | Intervālu skalas vērtības tiek pārvērstas pakāpēs un tiek izmantots ranga koeficients | Pīrsona korelācijas koeficients (lineārās korelācijas koeficients) |
Plkst r=0 nav lineāras korelācijas. Šajā gadījumā mainīgo lielumu grupas vidējie lielumi sakrīt ar to vispārīgajiem vidējiem, un regresijas līnijas ir paralēlas koordinātu asīm.
Vienlīdzība r=0 runā tikai par lineārās korelācijas atkarības neesamību (nekorelēti mainīgie), bet ne kopumā par korelācijas neesamību un vēl jo vairāk par statistisko atkarību.
Dažreiz secinājums, ka korelācijas nav, ir svarīgāks par spēcīgas korelācijas klātbūtni. Nulles korelācija starp diviem mainīgajiem var norādīt, ka viens mainīgais neietekmē otru, ja mēs ticam mērījumu rezultātiem.
SPSS: 11.3.2. Korelācijas koeficienti
Līdz šim esam noskaidrojuši tikai pašu faktu par statistiskās attiecības esamību starp divām pazīmēm. Tālāk mēģināsim noskaidrot, kādus secinājumus var izdarīt par šīs atkarības stiprumu vai vājumu, kā arī par tās formu un virzienu. Mainīgo attiecību kvantitatīvās noteikšanas kritērijus sauc par korelācijas koeficientiem vai savienojamības mēriem. Divi mainīgie ir pozitīvi korelēti, ja starp tiem ir tieša, vienvirziena saistība. Vienvirziena attiecībās viena mainīgā mazas vērtības atbilst otra mainīgā mazām vērtībām, lielas vērtības atbilst lielajām. Divi mainīgie ir negatīvi korelēti, ja starp tiem ir apgriezta sakarība. Izmantojot daudzvirzienu attiecības, viena mainīgā mazas vērtības atbilst otra mainīgā lielajām vērtībām un otrādi. Korelācijas koeficientu vērtības vienmēr ir diapazonā no -1 līdz +1.
Spīrmena koeficients tiek izmantots kā korelācijas koeficients starp mainīgajiem, kas pieder pie kārtas skalas, un Pīrsona korelācijas koeficients (produktu moments) tiek izmantots mainīgajiem, kas pieder intervālu skalai. Šajā gadījumā jāņem vērā, ka katru dihotomu mainīgo, tas ir, mainīgo, kas pieder pie nominālās skalas un kam ir divas kategorijas, var uzskatīt par kārtas.
Pirmkārt, mēs pārbaudīsim, vai pastāv korelācija starp dzimuma un psihes mainīgajiem no faila studium.sav. To darot, mēs ņemam vērā, ka dihotomu mainīgo dzimumu var uzskatīt par kārtas mainīgo. Veiciet tālāk norādītās darbības.
Komandu izvēlnē atlasiet Analizēt (Analīze) Aprakstošā statistika (Aprakstošā statistika) Crosstabs... (Neparedzamības tabulas)
· Pārvietojiet mainīgo dzimumu uz rindu sarakstu un mainīgo psihi uz kolonnu sarakstu.
· Noklikšķiniet uz pogas Statistika.... Dialoglodziņā Crosstabs: Statistics atzīmējiet izvēles rūtiņu Korelācijas. Apstipriniet savu izvēli ar pogu Turpināt.
· Dialoglodziņā Crosstabs pārtrauciet tabulu rādīšanu, atzīmējot izvēles rūtiņu Apspiest tabulas. Noklikšķiniet uz pogas Labi.
Tiks aprēķināti Spīrmena un Pīrsona korelācijas koeficienti un pārbaudīta to nozīme:
/ SPSS 10
10. uzdevums Korelācijas analīze
Korelācijas jēdziens
Korelācija jeb korelācijas koeficients ir statistisks rādītājs varbūtības attiecības starp diviem mainīgajiem, ko mēra kvantitatīvās skalās. Atšķirībā no funkcionālā savienojuma, kurā atbilst katra viena mainīgā vērtība stingri noteiktas cita mainīgā vērtība, varbūtības savienojums ko raksturo tas, ka katra viena mainīgā vērtība atbilst vērtību kopums Vēl viens mainīgais, varbūtības attiecību piemērs ir attiecība starp cilvēku augumu un svaru. Ir skaidrs, ka dažāda svara cilvēkiem var būt vienāds augums un otrādi.
Korelācija ir vērtība no -1 līdz + 1, un to apzīmē ar burtu r. Turklāt, ja vērtība ir tuvāk 1, tas nozīmē spēcīga savienojuma klātbūtni, un, ja tā ir tuvāk 0, tad vāju. Korelācijas vērtība, kas ir mazāka par 0,2, tiek uzskatīta par vāju korelāciju, vairāk nekā 0,5 - augsta. Ja korelācijas koeficients ir negatīvs, tas nozīmē, ka pastāv apgriezta sakarība: jo lielāka ir viena mainīgā vērtība, jo mazāka ir otra vērtība.
Atkarībā no pieņemtajām koeficienta r vērtībām var izdalīt dažādus korelācijas veidus:
Spēcīga pozitīva korelācija nosaka ar vērtību r=1. Termins "stingrs" nozīmē, ka viena mainīgā vērtību unikāli nosaka cita mainīgā vērtības, un termins " pozitīvs" - ka, pieaugot viena mainīgā vērtībai, palielinās arī otra mainīgā vērtība.
Stingra korelācija ir matemātiska abstrakcija, un reālos pētījumos tā gandrīz nekad nenotiek.
pozitīva korelācija atbilst vērtībām 0
Korelācijas trūkums nosaka ar vērtību r=0. Nulles korelācijas koeficients norāda, ka mainīgo lielumu vērtības nekādā veidā nav saistītas viena ar otru.
Korelācijas trūkums H o : 0 r xy =0 formulēts kā pārdomas null hipotēzes korelācijas analīzē.
negatīva korelācija: -1
Spēcīga negatīva korelācija nosaka ar vērtību r= -1. Tā, tāpat kā stingra pozitīva korelācija, ir abstrakcija un neatrodas praktiskajā pētniecībā.
1. tabula
Korelācijas veidi un to definīcijas
Korelācijas koeficienta aprēķināšanas metode ir atkarīga no skalas veida, kurā tiek mērītas mainīgā lieluma vērtības.
Korelācijas koeficients rPīrsons ir galvenais, un to var izmantot mainīgajiem ar nominālām un daļēji sakārtotām intervālu skalām, kuru vērtību sadalījums atbilst normālam (produkta momentu korelācija). Pīrsona korelācijas koeficients sniedz diezgan precīzus rezultātus arī neparastu sadalījumu gadījumos.
Neparastiem sadalījumiem ir vēlams izmantot Spīrmena un Kendala ranga korelācijas koeficientus. Tie ir sarindoti, jo programma iepriekš sarindo korelētos mainīgos.
Programma SPSS aprēķina r-Spīrmena korelāciju šādi: vispirms mainīgos lielumus pārvērš rangos, un pēc tam rangiem piemēro Pīrsona formulu.
M. Kendala piedāvātā korelācija balstās uz domu, ka savienojuma virzienu var spriest, salīdzinot subjektus pa pāriem. Ja subjektu pārim X izmaiņas virzienā sakrīt ar Y izmaiņām, tad tas norāda uz pozitīvu saistību. Ja nesakrīt, tad par negatīvām attiecībām. Šo koeficientu galvenokārt izmanto psihologi, kas strādā ar maziem paraugiem. Tā kā sociologi strādā ar lieliem datu masīviem, ir grūti kārtot pa pāriem, noteikt atšķirību relatīvajās frekvencēs un visu paraugā iekļauto subjektu pāru inversijās. Visizplatītākais ir koeficients. Pīrsons.
Tā kā korelācijas koeficients rPearson ir galvenais un to var izmantot (ar zināmu kļūdu atkarībā no skalas veida un sadalījuma anomāliju līmeņa) visiem mainīgajiem, kas mērīti kvantitatīvās skalās, mēs apsvērsim tā izmantošanas piemērus un salīdzināsim rezultātus, kas iegūti ar mērījumu rezultātiem, izmantojot citus korelācijas koeficientus.
Koeficienta aprēķināšanas formula r- Pīrsons:
r xy = ∑ (Xi-Xav)∙ (Yi-Yav) / (N-1) ∙σ x ∙σ y ∙
Kur: Xi, Yi- divu mainīgo vērtības;
Xav, Yav - divu mainīgo vidējās vērtības;
σ x , σ y ir standartnovirzes,
N ir novērojumu skaits.
Pāru korelācijas
Piemēram, mēs vēlētos noskaidrot, kā atbildes starp dažādiem tradicionālo vērtību veidiem korelē skolēnu priekšstatos par ideālo darba vietu (mainīgie: a9.1, a9.3, a9.5, a9.7) , un tad par liberālo vērtību attiecību (a9 .2, a9.4, a9.6, a9.8). Šie mainīgie tiek mērīti 5 termiņu sakārtotās skalās.
Mēs izmantojam procedūru: "Analīze", "Korelācijas", "Pārī". Pēc noklusējuma koeficients Pīrsons ir iestatīts dialoglodziņā. Mēs izmantojam koeficientu Pīrsons
Pārbaudītie mainīgie tiek pārsūtīti uz atlases logu: a9.1, a9.3, a9.5, a9.7
Nospiežot OK, mēs iegūstam aprēķinu:
Korelācijas
a9.1.t. Cik svarīgi ir pietiekami daudz laika ģimenei un personīgajai dzīvei? |
Pīrsona korelācija |
||||
Vērtība (divpusēja) |
|||||
a9.3.t. Cik svarīgi ir nebaidīties zaudēt darbu? |
Pīrsona korelācija |
||||
Vērtība (divpusēja) |
|||||
a9.5.t. Cik svarīgi ir tāds priekšnieks, kurš ar tevi konsultēsies, pieņemot tādu vai citu lēmumu? |
Pīrsona korelācija |
||||
Vērtība (divpusēja) |
|||||
a9.7.t. Cik svarīgi ir strādāt labi koordinētā komandā, justies kā daļai no tās? |
Pīrsona korelācija |
||||
Vērtība (divpusēja) |
|||||
** Korelācija ir nozīmīga 0,01 līmenī (divpusēja).
Konstruētās korelācijas matricas kvantitatīvo vērtību tabula
Daļējas korelācijas:
Vispirms izveidosim pāru korelāciju starp šiem diviem mainīgajiem:
Korelācijas |
|||
c8. Jūtieties tuvu tiem, kas dzīvo jūsu tuvumā, kaimiņi |
Pīrsona korelācija |
||
Vērtība (divpusēja) |
|||
c12. Jūtieties tuvu viņu ģimenei |
Pīrsona korelācija |
||
Vērtība (divpusēja) |
|||
**. Korelācija ir nozīmīga 0,01 līmenī (divpusēja). |
Tad mēs izmantojam daļējas korelācijas konstruēšanas procedūru: "Analīze", "Korelācijas", "Daļēja".
Pieņemsim, ka vērtība “Ir svarīgi patstāvīgi noteikt un mainīt sava darba secību” attiecībā pret norādītajiem mainīgajiem būs izšķirošais faktors, kura ietekmē iepriekš identificētās attiecības izzudīs vai izrādīsies maznozīmīgas. .
Korelācijas |
||||
Izslēgtie mainīgie |
c8. Jūtieties tuvu tiem, kas dzīvo jūsu tuvumā, kaimiņi |
c12. Jūtieties tuvu viņu ģimenei |
||
c16. Jūtieties tuvu cilvēkiem, kuriem ir tāda pati bagātība kā jums |
c8. Jūtieties tuvu tiem, kas dzīvo jūsu tuvumā, kaimiņi |
Korelācija |
||
Nozīme (divpusējs) |
||||
c12. Jūtieties tuvu viņu ģimenei |
Korelācija |
|||
Nozīme (divpusējs) |
||||
Kā redzams no tabulas, kontroles mainīgā ietekmē attiecība nedaudz samazinājās: no 0,120 līdz 0,102. tas paliek pietiekami augsts un ļauj atspēkot nulles hipotēzi ar nulles kļūdu.
Korelācijas koeficients
Visprecīzākais veids, kā noteikt korelācijas stingrību un raksturu, ir atrast korelācijas koeficientu. Korelācijas koeficients ir skaitlis, ko nosaka pēc formulas:
kur r xy ir korelācijas koeficients;
x i - pirmās pazīmes vērtības;
i - otrās pazīmes vērtības;
Pirmās pazīmes vērtību vidējais aritmētiskais
Otrās pazīmes vērtību vidējais aritmētiskais
Lai izmantotu formulu (32), mēs izveidojam tabulu, kas nodrošinās nepieciešamo secību skaitļu sagatavošanā, lai atrastu korelācijas koeficienta skaitītāju un saucēju.
Kā redzams no formulas (32), darbību secība ir šāda: atrodam abu zīmju x un y vidējos aritmētiskos, atrodam atšķirību starp zīmes vērtībām un tās vidējo vērtību (х i - ) un y i - ), tad atrodam to reizinājumu (х i - ) ( y i - ) – pēdējā summa dod korelācijas koeficienta skaitītāju. Lai atrastu tā saucēju, ir jāliek kvadrātā atšķirības (x i -) un (y i -), jāatrod to summas un jāizņem kvadrātsakne no to reizinājuma.
Tātad, piemēram, 31. korelācijas koeficienta atrašanu saskaņā ar formulu (32) var attēlot šādi (50. tabula).
Rezultātā iegūtais korelācijas koeficienta skaitlis ļauj noteikt attiecību esamību, tuvumu un raksturu.
1. Ja korelācijas koeficients ir nulle, starp pazīmēm nav sakarības.
2. Ja korelācijas koeficients ir vienāds ar vienu, sakarība starp pazīmēm ir tik liela, ka pārvēršas funkcionālā.
3. Korelācijas koeficienta absolūtā vērtība nepārsniedz intervālu no nulles līdz vienam:
Tas ļauj koncentrēties uz savienojuma blīvumu: jo tuvāk koeficients ir nullei, jo vājāks savienojums, un jo tuvāk vienotībai, jo ciešāks savienojums.
4. Korelācijas koeficienta zīme "plus" nozīmē tiešu korelāciju, zīme "mīnus" nozīmē pretējo.
Tabula 50
x i | i | (х i - ) | (y i - ) | (x i - )(y i - ) | (х i - )2 | (y i - )2 |
14,00 | 12,10 | -1,70 | -2,30 | +3,91 | 2,89 | 5,29 |
14,20 | 13,80 | -1,50 | -0,60 | +0,90 | 2,25 | 0,36 |
14,90 | 14,20 | -0,80 | -0,20 | +0,16 | 0,64 | 0,04 |
15,40 | 13,00 | -0,30 | -1,40 | +0,42 | 0,09 | 1,96 |
16,00 | 14,60 | +0,30 | +0,20 | +0,06 | 0,09 | 0,04 |
17,20 | 15,90 | +1,50 | +2,25 | 2,25 | ||
18,10 | 17,40 | +2,40 | +2,00 | +4,80 | 5,76 | 4,00 |
109,80 | 101,00 | 12,50 | 13,97 | 13,94 |
Tādējādi 31. piemērā aprēķinātais korelācijas koeficients ir r xy = +0,9. ļauj izdarīt šādus secinājumus: pastāv korelācija starp labās un kreisās rokas muskuļu spēka lielumu pētītajiem skolēniem (koeficients r xy \u003d + 0,9 nav nulle), attiecības ir ļoti ciešas (koeficients r xy \u003d + 0,9 ir tuvu vienotībai), korelācija ir tieša (koeficients r xy = +0,9 ir pozitīvs), t.i., palielinoties vienas rokas muskuļu spēkam, palielinās otras rokas spēks.
Aprēķinot korelācijas koeficientu un izmantojot tā īpašības, jāņem vērā, ka secinājumi dod pareizus rezultātus, ja pazīmes ir normāli sadalītas un tiek ņemta vērā saistība starp lielu skaitu abu pazīmju vērtību.
Aplūkotajā 31. piemērā tika analizētas tikai 7 abu pazīmju vērtības, kas, protams, nav pietiekami šādiem pētījumiem. Šeit vēlreiz atgādinām, ka piemēri šajā grāmatā kopumā un jo īpaši šajā nodaļā ir ilustrācijas metodes, nevis kādu zinātnisku eksperimentu detalizēts izklāsts. Rezultātā tiek ņemts vērā neliels skaits pazīmju vērtību, mērījumi tiek noapaļoti - tas viss tiek darīts, lai ar apgrūtinošiem aprēķiniem neaizsegtu metodes ideju.
Īpaša uzmanība jāpievērš aplūkojamo attiecību būtībai. Korelācijas koeficients nevar novest pie pareiziem pētījuma rezultātiem, ja pazīmju attiecību analīze tiek veikta formāli. Atgriezīsimies pie 31. piemēra. Abas aplūkotās pazīmes bija labās un kreisās rokas muskuļu spēka vērtības. Iedomāsimies, ka ar pazīmi x i 31. piemērā (14.0; 14.2; 14.9... ...18.1) saprotam nejauši noķerto zivju garumu centimetros, bet ar pazīmi y i (12.1 ; 13.8; 14.2 ... ... 17.4) - instrumentu svars laboratorijā kilogramos. Formāli, izmantojot aprēķinu aparātu korelācijas koeficienta atrašanai un šajā gadījumā arī iegūstot r xy =+0>9, vajadzēja secināt, ka pastāv cieša tieša sakarība starp zivs garumu un zivju svaru. instrumenti. Šāda secinājuma absurds ir acīmredzams.
Lai izvairītos no formālas pieejas korelācijas koeficienta lietošanai, jāizmanto jebkura cita metode - matemātiska, loģiskā, eksperimentālā, teorētiskā -, lai noteiktu korelācijas iespēju starp zīmēm, tas ir, lai noteiktu zīmju organisko vienotību. Tikai tad var sākt izmantot korelācijas analīzi un noteikt attiecību lielumu un raksturu.
Matemātiskajā statistikā ir arī jēdziens daudzkārtēja korelācija- Attiecības starp trim vai vairākām funkcijām. Šajos gadījumos tiek izmantots daudzkārtējs korelācijas koeficients, kas sastāv no iepriekš aprakstītajiem pāru korelācijas koeficientiem.
Piemēram, trīs zīmju - x і , y і , z і - korelācijas koeficients ir:
kur R xyz - daudzkārtējās korelācijas koeficients, kas izsaka, kā pazīme x i ir atkarīga no pazīmēm y i un z i ;
r xy -korelācijas koeficients starp pazīmēm x i un y i ;
r xz - korelācijas koeficients starp pazīmēm Xi un Zi;
r yz - korelācijas koeficients starp pazīmēm y i , z i
Korelācijas analīze ir:
Korelācijas analīzeKorelācija- divu vai vairāku gadījuma lielumu (vai mainīgo, kurus var uzskatīt par tādiem ar zināmu pieņemamu precizitāti) statistiskā attiecība. Tajā pašā laikā izmaiņas vienā vai vairākos no šiem daudzumiem izraisa sistemātiskas izmaiņas citos vai citos daudzumos. Korelācijas koeficients kalpo kā matemātisks divu nejaušu mainīgo korelācijas mērs.
Korelācija var būt pozitīva un negatīva (iespējams arī, ka nav statistiskas sakarības - piemēram, neatkarīgiem gadījuma mainīgajiem). negatīva korelācija - korelācija, kurā viena mainīgā lieluma palielināšanās ir saistīta ar cita mainīgā lieluma samazināšanos, savukārt korelācijas koeficients ir negatīvs. pozitīva korelācija - korelācija, kurā viena mainīgā lieluma palielināšanās ir saistīta ar cita mainīgā lieluma palielināšanos, savukārt korelācijas koeficients ir pozitīvs.
autokorelācija - statistiskās attiecības starp nejaušiem mainīgajiem no vienas un tās pašas sērijas, bet ņemtas ar nobīdi, piemēram, nejaušam procesam - ar nobīdi laikā.
Statistikas datu apstrādes metodi, kas sastāv no mainīgo lielumu koeficientu (korelāciju) izpētes, sauc par korelācijas analīze.
Korelācijas koeficients
Korelācijas koeficients vai pāra korelācijas koeficients varbūtību teorijā un statistikā tas ir divu nejaušu lielumu izmaiņu rakstura rādītājs. Korelācijas koeficients ir apzīmēts ar latīņu burtu R, un tā vērtības var būt no -1 līdz +1. Ja moduļa vērtība ir tuvāk 1, tad tas nozīmē spēcīga savienojuma klātbūtni (ar korelācijas koeficientu, kas vienāds ar vienu, viņi runā par funkcionālu savienojumu), un, ja tuvāk 0, tad vāju.
Pīrsona korelācijas koeficients
Metriskajiem lielumiem tiek izmantots Pīrsona korelācijas koeficients, kura precīzu formulu ieviesa Frensiss Galtons:
Ļaujiet X,Y- divi nejauši mainīgie, kas definēti vienā un tajā pašā varbūtības telpā. Tad to korelācijas koeficientu nosaka pēc formulas:
![](https://i0.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
![](https://i1.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
kur cov ir kovariance un D ir dispersija vai līdzvērtīgi,
,kur simbols apzīmē matemātisko cerību.
Lai grafiski attēlotu šādas attiecības, varat izmantot taisnstūra koordinātu sistēmu ar asīm, kas atbilst abiem mainīgajiem. Katrs vērtību pāris ir atzīmēts ar noteiktu simbolu. Šādu sižetu sauc par "izkliedes diagrammu".
Korelācijas koeficienta aprēķināšanas metode ir atkarīga no skalas veida, uz kuru attiecas mainīgie. Tātad, lai mērītu mainīgos lielumus ar intervālu un kvantitatīvām skalām, nepieciešams izmantot Pīrsona korelācijas koeficientu (produktu momentu korelāciju). Ja vismaz vienam no diviem mainīgajiem ir kārtas skala vai tas nav normāli sadalīts, jāizmanto Spīrmena ranga korelācija vai Kendala τ (tau). Gadījumā, ja viens no diviem mainīgajiem ir dihotoms, tiek izmantota punktu divu sēriju korelācija, un, ja abi mainīgie ir dihotomiski, tiek izmantota četru lauku korelācija. Korelācijas koeficienta aprēķināšanai starp diviem nedihotomiem mainīgajiem ir jēga tikai tad, ja attiecība starp tiem ir lineāra (vienvirziena).
Kendela korelācijas koeficients
Izmanto, lai izmērītu savstarpējos traucējumus.
Spīrmena korelācijas koeficients
Korelācijas koeficienta īpašības
- Košī-Buņakovska nevienlīdzība:
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
Korelācijas analīze
Korelācijas analīze- statistikas datu apstrādes metode, kas sastāv no koeficientu izpētes ( korelācijas) starp mainīgajiem. Šajā gadījumā korelācijas koeficienti starp vienu pāri vai vairākiem pazīmju pāriem tiek salīdzināti, lai noteiktu statistiskās attiecības starp tiem.
Mērķis korelācijas analīze- sniegt informāciju par vienu mainīgo ar cita mainīgā palīdzību. Gadījumos, kad ir iespējams sasniegt mērķi, mēs sakām, ka mainīgie korelē. Vispārīgākajā formā korelācijas esamības hipotēzes pieņemšana nozīmē, ka mainīgā A vērtības izmaiņas notiks vienlaikus ar proporcionālām B vērtības izmaiņām: ja abi mainīgie palielinās, tad korelācija ir pozitīva ja viens mainīgais palielinās, bet otrs samazinās, korelācija ir negatīva.
Korelācija atspoguļo tikai lielumu lineāro atkarību, bet neatspoguļo to funkcionālo savienojamību. Piemēram, ja mēs aprēķinām korelācijas koeficientu starp vērtībām A = sin(x) un B = cos(x), tad tas būs tuvu nullei, t.i., starp daudzumiem nav atkarības. Tikmēr lielumi A un B ir acīmredzami funkcionāli saistīti saskaņā ar likumu sin 2(x) + cos 2(x) = 1.
Korelācijas analīzes ierobežojumi
![](https://i1.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
![](https://i0.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
- Pielietojums ir iespējams, ja ir pietiekams pētāmo gadījumu skaits: konkrētam korelācijas koeficienta veidam tas svārstās no 25 līdz 100 novērojumu pāriem.
- Otrais ierobežojums izriet no korelācijas analīzes hipotēzes, kas ietver mainīgo lineārā atkarība. Daudzos gadījumos, kad ir ticami zināms, ka atkarība pastāv, korelācijas analīze var nedot rezultātus tikai tāpēc, ka atkarība ir nelineāra (izteikta, piemēram, kā parabola).
- Pats par sevi korelācijas fakts nedod pamatu apgalvot, kurš no mainīgajiem lielumiem ir pirms vai izraisa izmaiņas, vai arī to, ka mainīgie parasti ir viens ar otru cēloņsakarībā, piemēram, trešā faktora darbības dēļ.
Pielietojuma zona
Šī statistikas datu apstrādes metode ir ļoti populāra ekonomikā un sociālajās zinātnēs (jo īpaši psiholoģijā un socioloģijā), lai gan korelācijas koeficientu piemērošanas joma ir plaša: rūpniecisko produktu kvalitātes kontrole, metalurģija, lauksaimniecības ķīmija, hidrobioloģija, biometrija, un citi.
Metodes popularitāte ir saistīta ar diviem punktiem: korelācijas koeficientus ir salīdzinoši viegli aprēķināt, to pielietošanai nav nepieciešama īpaša matemātiskā sagatavotība. Apvienojumā ar interpretācijas vieglumu, koeficienta piemērošanas vienkāršība ir novedusi pie tā plašas izmantošanas statistikas datu analīzes jomā.
viltus korelācija
Bieži vien vilinošā korelācijas pētījuma vienkāršība mudina pētnieku izdarīt nepareizus intuitīvus secinājumus par cēloņsakarības esamību starp pazīmju pāriem, savukārt korelācijas koeficienti nosaka tikai statistiskas attiecības.
Mūsdienu sociālo zinātņu kvantitatīvā metodoloģijā faktiski ir atmests mēģinājums ar empīriskām metodēm noteikt cēloņsakarības starp novērotajiem mainīgajiem. Tāpēc, kad sociālo zinātņu pētnieki runā par sakarību nodibināšanu starp pētāmajiem mainīgajiem, tiek domāts vai nu vispārējs teorētisks pieņēmums, vai statistiska atkarība.
Skatīt arī
- Autokorelācijas funkcija
- Krusta korelācijas funkcija
- kovariācija
- Determinācijas koeficients
- Regresijas analīze
Wikimedia fonds. 2010. gads.
Var būt saistītas dažādas funkcijas.
Starp tiem ir 2 savienojuma veidi:
- funkcionāls;
- korelācija.
Korelācija tulkots krieviski - nekas vairāk kā savienojums.
Korelācijas gadījumā ir vairāku viena atribūta vērtību atbilstība vairākām cita atribūta vērtībām. Kā piemērus mēs varam uzskatīt konstatētās korelācijas starp:
- ķepu, kakla, knābja garums putniem, piemēram, gārņiem, dzērvēm, stārķiem;
- ķermeņa temperatūras un sirdsdarbības ātruma rādītāji.
Lielākajai daļai biomedicīnas procesu šāda veida savienojumu klātbūtne ir statistiski pierādīta.
Statistiskās metodes ļauj konstatēt pazīmju savstarpējās atkarības pastāvēšanas faktu. Šim nolūkam izmantojot īpašus aprēķinus, tiek izveidoti korelācijas koeficienti (savienojamības mēri).
Tādus aprēķinus sauc korelācijas analīze. To veic, lai apstiprinātu 2 mainīgo (gadījuma mainīgo) atkarību viens no otra, ko izsaka ar korelācijas koeficientu.
Korelācijas metodes izmantošana ļauj atrisināt vairākas problēmas:
- identificēt saistību starp analizētajiem parametriem;
- zināšanas par korelācijas esamību ļauj risināt prognozēšanas problēmas. Tādējādi pastāv reāla iespēja paredzēt parametra uzvedību, pamatojoties uz cita korelēta parametra uzvedības analīzi;
- klasifikācija, kuras pamatā ir viena no otras neatkarīgu pazīmju atlase.
Mainīgajiem:
- saistībā ar kārtas skalu aprēķina Spīrmena koeficientu;
- kas saistīts ar intervālu skalu – Pīrsona koeficients.
Šie ir visbiežāk izmantotie parametri, taču ir arī citi.
Koeficienta vērtību var izteikt gan pozitīvi, gan negatīvi.
Pirmajā gadījumā, palielinoties viena mainīgā vērtībai, tiek novērots otrā lieluma pieaugums. Ar negatīvu koeficientu modelis tiek apgriezts.
Kam paredzēts korelācijas koeficients?
Nejaušiem mainīgajiem, kas saistīti viens ar otru, var būt pilnīgi atšķirīgs šī savienojuma raksturs. Tas ne vienmēr būs funkcionāls, ja starp daudzumiem ir tieša saistība. Visbiežāk abus lielumus ietekmē vesela dažādu faktoru kopums, gadījumos, kad tie ir kopīgi abiem lielumiem, tiek novērota saistītu modeļu veidošanās.
Tas nozīmē, ka statistiski pierādītais lielumu attiecības pastāvēšanas fakts nav apstiprinājums tam, ka ir konstatēts novēroto izmaiņu cēlonis. Kā likums, pētnieks secina, ka ir divas savstarpēji saistītas sekas.
Korelācijas koeficienta īpašības
Šai statistikai ir šādas īpašības:
- koeficienta vērtība svārstās no -1 līdz +1. Jo tuvāk galējām vērtībām, jo spēcīgāka ir pozitīvā vai negatīvā attiecība starp lineārajiem parametriem. Nulles vērtības gadījumā mēs runājam par korelācijas neesamību starp pazīmēm;
- pozitīva koeficienta vērtība norāda, ka viena atribūta vērtības pieauguma gadījumā tiek novērots otrais pieaugums (pozitīva korelācija);
- negatīva vērtība - viena atribūta vērtības pieauguma gadījumā tiek novērota otrā samazināšanās (negatīva korelācija);
- indikatora vērtības tuvošanās galējiem punktiem (-1 vai +1) norāda uz ļoti spēcīgas lineāras attiecības esamību;
- iezīmju rādītāji var mainīties ar nemainīgu koeficienta vērtību;
- korelācijas koeficients ir bezdimensijas lielums;
- korelācijas klātbūtne nav obligāts cēloņsakarības apstiprinājums.
Korelācijas koeficientu vērtības
Korelācijas stiprumu var raksturot, izmantojot Čeldoka skalu, kurā kvalitatīvs raksturlielums atbilst noteiktai skaitliskai vērtībai.
Pozitīvas korelācijas gadījumā pēc vērtības:
- 0-0,3 - korelācija ir ļoti vāja;
- 0,3-0,5 - vājš;
- 0,5-0,7 - vidēja stiprība;
- 0,7-0,9 - augsts;
- 0,9-1 - ļoti augsts korelācijas stiprums.
Skalu var izmantot arī negatīvai korelācijai. Šajā gadījumā kvalitatīvās īpašības tiek aizstātas ar pretējiem.
Varat izmantot vienkāršoto Čeldoka skalu, kurā izšķir tikai 3 korelācijas stipruma gradācijas:
- ļoti spēcīgi - rādītāji ± 0,7 - ± 1;
- vidējais - rādītāji ± 0,3 - ± 0,699;
- ļoti vāji - rādītāji 0 - ± 0,299.
Šis statistiskais rādītājs ļauj ne tikai pārbaudīt pieņēmumu par lineāras sakarības esamību starp pazīmēm, bet arī noteikt tā stiprumu.
Korelācijas koeficientu veidi
Korelācijas koeficientus var klasificēt pēc zīmes un vērtības:
- pozitīvs;
- nulles;
- negatīvs.
Atkarībā no analizētajām vērtībām aprēķina koeficientu:
- Pīrsons;
- Spīrmens;
- Kendala;
- Fehnera zīmes;
- saskaņa vai vairāku rangu korelācija.
Pīrsona korelācijas koeficientu izmanto, lai izveidotu tiešas saiknes starp mainīgo lielumu absolūtajām vērtībām. Šajā gadījumā abu mainīgo lielumu sēriju sadalījumiem vajadzētu tuvoties normālam. Salīdzināmajiem mainīgajiem ir jāatšķiras ar tādu pašu dažādu pazīmju skaitu. Mainīgos attēlojošajai skalai jābūt vai nu intervālu skalai, vai attiecību skalai.
- precīza korelācijas stipruma noteikšana;
- kvantitatīvo raksturlielumu salīdzinājums.
Pīrsona lineārās korelācijas koeficienta izmantošanai ir daži trūkumi:
- metode ir nestabila skaitlisko vērtību novirzes gadījumā;
- izmantojot šo metodi, korelācijas stiprumu iespējams noteikt tikai lineārai sakarībai, cita veida mainīgo savstarpējām attiecībām jāizmanto regresijas analīzes metodes.
Ranga korelāciju nosaka ar Spīrmena metodi, kas dod iespēju statistiski pētīt parādību savstarpējās attiecības. Pateicoties šim koeficientam, tiek aprēķināta divu kvantitatīvi izteiktu pazīmju virkņu faktiskā paralēlisma pakāpe, kā arī tiek novērtēts identificētās attiecības ciešums.
- nav nepieciešama precīza korelācijas stipruma vērtības definīcija;
- salīdzinātajiem rādītājiem ir gan kvantitatīvās, gan atributīvās vērtības;
- pazīmju rindu salīdzinājums ar atvērtajiem vērtību variantiem.
Spīrmena metode attiecas uz neparametriskās analīzes metodēm, tāpēc nav nepieciešams pārbaudīt pazīmju sadalījuma normalitāti. Turklāt tas ļauj salīdzināt dažādās skalās izteiktus rādītājus. Piemēram, salīdzinot sarkano asins šūnu skaita vērtības noteiktā asins tilpumā (nepārtraukta skala) un ekspertu vērtējumu, kas izteikts punktos (kārtas skala).
Metodes efektivitāti negatīvi ietekmē liela atšķirība starp salīdzināmo vērtību vērtībām. Metode ir neefektīva arī gadījumos, kad izmērīto vērtību raksturo nevienmērīgs vērtību sadalījums.
Soli pa solim korelācijas koeficienta aprēķināšana programmā Excel
Korelācijas koeficienta aprēķināšana ietver vairāku matemātisko darbību secīgu izpildi.
Iepriekš minētā Pīrsona koeficienta aprēķināšanas formula parāda, cik darbietilpīgs ir šis process, ja to veic manuāli.
Excell iespēju izmantošana paātrina koeficienta atrašanas procesu reizēm.
Pietiek ievērot vienkāršu darbību algoritmu:
- pamatinformācijas ievads - x vērtību kolonna un y vērtību kolonna;
- rīkos tiek atlasīta un atvērta cilne Formulas;
- atvērtajā cilnē atlasiet "Ievietot fx funkciju";
- atvērtajā dialoglodziņā ir atlasīta statistiskā funkcija "Korrels", kas ļauj aprēķināt korelācijas koeficientu starp 2 datu masīviem;
- Atvērtajā logā tiek ievadīti dati: 1. masīvs - kolonnas x vērtību diapazons (jāatlasa dati), 2. masīvs - y kolonnas vērtību diapazons;
- tiek nospiests taustiņš “OK”, koeficienta aprēķina rezultāts parādās rindā “vērtība”;
- secinājums par korelācijas esamību starp 2 datu kopām un tās stiprumu.
Korelācijas modelis (CM) ir aprēķinu programma, kas nodrošina matemātisko vienādojumu, kurā iegūtais rādītājs tiek kvantificēts atkarībā no viena vai vairākiem rādītājiem.
yx \u003d ao + a1x1
kur: y - darbības rādītājs atkarībā no faktora x;
x - faktora zīme;
a1 - parametrs KM, kas parāda, cik ļoti mainīsies efektīvais rādītājs y, kad faktors x mainās par vienu, ja tajā pašā laikā visi pārējie faktori, kas ietekmē y, paliek nemainīgi;
ao - parametrs KM, kas parāda visu pārējo faktoru ietekmi uz efektīvo rādītāju y, izņemot faktora zīmi x
Izvēloties modeļa efektīvos un faktoru rādītājus, jāņem vērā fakts, ka efektīvais rādītājs cēloņu un seku attiecību ķēdē ir augstākā līmenī nekā faktoru rādītāji.
Korelācijas modeļa raksturojums
Pēc korelācijas modeļa parametru aprēķināšanas tiek aprēķināts korelācijas koeficients.
p - pāra korelācijas koeficients, -1 ≤ p ≤ 1, parāda faktora rādītāja ietekmes spēku un virzienu uz efektīvo. Jo tuvāk 1, jo stiprākas attiecības, jo tuvāk 0, jo vājākas attiecības. Ja korelācijas koeficients ir pozitīvs, tad sakarība ir tieša, ja tā ir negatīva, tā ir apgriezta.
Korelācijas koeficienta formula: pxy \u003d (xy-x * 1 / y) / eh * eu
ex=xx2-(x)2 ; eu=y2-(y)2
Ja CM ir lineārs daudzfaktoru, kam ir šāda forma:
yx \u003d ao + a1x1 + a2x2 + ... + axp
tad tam aprēķina daudzkārtējo korelācijas koeficientu.
0 ≤ Р ≤ 1 un parāda visu faktoru rādītāju ietekmes stiprumu kopā uz efektīvo.
P \u003d 1- ((uh-uy) 2 / (yi - usr) 2)
Kur: uh - efektīvais rādītājs - aprēķinātā vērtība;
ui - faktiskā vērtība;
usr - faktiskā vērtība, vidējā.
Aprēķinātā vērtība yx tiek iegūta aizstāšanas rezultātā korelācijas modelī, nevis x1, x2 utt. to faktiskās vērtības.
Viena faktora un daudzfaktoru nelineārajiem modeļiem korelācijas koeficientu aprēķina:
1 ≤ m ≤ 1;
Tiek uzskatīts, ka modelī iekļautā efektīvā un faktorrādītāja sakarība ir vāja, ja savienojuma ciešuma koeficienta (m) vērtība ir 0-0,3 robežās; ja 0,3-0,7 - savienojuma blīvums ir vidējs; virs 0,7-1 - savienojums ir spēcīgs.
Tā kā korelācijas koeficients (pārī) p, korelācijas koeficients (vairākkārtējs) P, korelācijas koeficients m ir varbūtības vērtības, tad tām tiek aprēķināti to nozīmīguma koeficienti (noteikti no tabulām). Ja šie koeficienti ir lielāki par to tabulas vērtību, tad savienojuma ciešuma koeficienti ir nozīmīgi iemesli. Ja savienojuma blīvuma nozīmīguma koeficienti ir mazāki par tabulas vērtībām vai arī pats savienojuma koeficients ir mazāks par 0,7, tad modelī nav iekļauti visi faktoru rādītāji, kas būtiski ietekmē rezultātu.
Determinācijas koeficients uzskatāmi parāda modelī iekļauto faktoru rādītāju procentuālo daudzumu, kas nosaka rezultāta veidošanos.
Ja determinācijas koeficients ir lielāks par 50, tad modelis adekvāti apraksta pētāmo procesu, ja tas ir mazāks par 50, tad ir jāatgriežas pie pirmās būvniecības stadijas un jāpārskata faktoru rādītāju atlase iekļaušanai tajā. modelis.
Fišera koeficients jeb Fišera kritērijs raksturo modeļa efektivitāti kopumā. Ja aprēķinātā koeficienta vērtība pārsniedz tabulas vērtību, tad konstruētais modelis ir piemērots analīzei, kā arī rādītāju plānošanai, nākotnes aprēķiniem. Aptuvenā tabulas vērtība \u003d 1,5. Ja aprēķinātā vērtība ir mazāka par tabulas vērtību, vispirms ir nepieciešams izveidot modeli, iekļaujot faktorus, kas būtiski ietekmē rezultātu. Papildus modeļa efektivitātei kopumā, katrs regresijas koeficients ietekmē būtiskumu. Ja šī koeficienta aprēķinātā vērtība pārsniedza tabulas vērtību, tad regresijas koeficients būs nozīmīgs, ja tas ir mazāks, tad faktora rādītājs, kuram šis koeficients tiek aprēķināts, tiek izņemts no izlases, aprēķini sākas no jauna, bet bez šī faktora .
Korelācijas koeficients ir saistību pakāpe starp diviem mainīgajiem. Tās aprēķins sniedz priekšstatu par to, vai pastāv saistība starp divām datu kopām. Atšķirībā no regresijas, korelācija neļauj prognozēt vērtības. Tomēr koeficienta aprēķināšana ir svarīgs sākotnējās statistiskās analīzes posms. Piemēram, konstatējām, ka korelācijas koeficients starp ārvalstu tiešo investīciju līmeni un IKP pieaugumu ir augsts. Tas rada priekšstatu, ka labklājības nodrošināšanai ir jārada īpaši ārvalstu uzņēmējiem labvēlīgs klimats. No pirmā acu uzmetiena nav tik acīmredzams secinājums!
Korelācija un cēloņsakarība
Varbūt nav nevienas statistikas jomas, kas būtu tik stingri nostiprināta mūsu dzīvē. Korelācijas koeficients tiek izmantots visās sabiedrības zināšanu jomās. Tās galvenās briesmas slēpjas apstāklī, ka nereti tiek spekulēts par tās augstajām vērtībām, lai pārliecinātu cilvēkus un liktu tiem noticēt kādiem secinājumiem. Tomēr patiesībā spēcīga korelācija nepavisam neliecina par cēloņsakarību starp daudzumiem.
Korelācijas koeficients: Pīrsona un Spīrmena formula
Ir vairāki galvenie rādītāji, kas raksturo attiecības starp diviem mainīgajiem. Vēsturiski pirmais ir Pīrsona lineārās korelācijas koeficients. Tas tiek nodots skolā. To izstrādāja K. Pearson un J. Yule, pamatojoties uz Fr. Galtons. Šis koeficients ļauj redzēt attiecības starp racionāliem skaitļiem, kas mainās racionāli. Tas vienmēr ir lielāks par -1 un mazāks par 1. Negatīvs skaitlis norāda uz apgriezti proporcionālu sakarību. Ja koeficients ir nulle, tad starp mainīgajiem nav nekādas attiecības. Vienāds ar pozitīvu skaitli - starp pētītajiem lielumiem pastāv tieši proporcionāla sakarība. Spīrmena rangu korelācijas koeficients ļauj vienkāršot aprēķinus, veidojot mainīgo vērtību hierarhiju.
Attiecības starp mainīgajiem
Korelācija palīdz atbildēt uz diviem jautājumiem. Pirmkārt, vai attiecības starp mainīgajiem lielumiem ir pozitīvas vai negatīvas. Otrkārt, cik spēcīga ir atkarība. Korelācijas analīze ir spēcīgs instruments šīs svarīgās informācijas iegūšanai. Ir viegli redzēt, ka mājsaimniecību ienākumi un izdevumi proporcionāli pieaug un samazinās. Šādas attiecības tiek uzskatītas par pozitīvām. Gluži pretēji, kad preces cena pieaug, pieprasījums pēc tās samazinās. Šādas attiecības sauc par negatīvām. Korelācijas koeficienta vērtības ir no -1 līdz 1. Nulle nozīmē, ka starp pētītajām vērtībām nav sakarības. Jo tuvāk rādītājs galējām vērtībām, jo spēcīgāka ir saistība (negatīva vai pozitīva). Par atkarības neesamību liecina koeficients no -0,1 līdz 0,1. Ir jāsaprot, ka šāda vērtība tikai norāda uz lineāras attiecības neesamību.
Lietojumprogrammas funkcijas
Abu rādītāju izmantošana ir atkarīga no noteiktiem pieņēmumiem. Pirmkārt, spēcīgu attiecību klātbūtne nenosaka faktu, ka viena vērtība nosaka otru. Var būt arī trešais daudzums, kas nosaka katru no tiem. Otrkārt, augsts Pīrsona korelācijas koeficients nenorāda uz cēloņsakarību starp pētītajiem mainīgajiem. Treškārt, tas parāda tikai lineāras attiecības. Korelāciju var izmantot, lai novērtētu nozīmīgus kvantitatīvos datus (piemēram, barometrisko spiedienu, gaisa temperatūru), nevis tādas kategorijas kā dzimums vai iecienītākā krāsa.
Daudzkārtējs korelācijas koeficients
Pīrsons un Spīrmens pētīja attiecības starp diviem mainīgajiem. Bet ko darīt, ja tādu ir trīs vai pat vairāk. Šeit parādās daudzkārtējās korelācijas koeficients. Piemēram, nacionālo kopproduktu ietekmē ne tikai ārvalstu tiešās investīcijas, bet arī valsts monetārā un fiskālā politika, kā arī eksporta līmenis. IKP pieauguma temps un apjoms ir vairāku faktoru mijiedarbības rezultāts. Tomēr jāsaprot, ka daudzkārtējās korelācijas modelis ir balstīts uz vairākiem vienkāršojumiem un pieņēmumiem. Pirmkārt, ir izslēgta daudzumu multikolinearitāte. Otrkārt, tiek pieņemts, ka attiecības starp atkarīgo mainīgo un mainīgajiem, kas to ietekmē, ir lineāras.
Korelācijas un regresijas analīzes izmantošanas jomas
Šo daudzumu attiecību noteikšanas metodi plaši izmanto statistikā. Visbiežāk tas tiek izmantots trīs galvenajos gadījumos:
- Cēloņsakarību pārbaudei starp divu mainīgo vērtībām. Rezultātā pētnieks cer atrast lineāru sakarību un iegūt formulu, kas apraksta šīs attiecības starp daudzumiem. To mērvienības var atšķirties.
- Lai pārbaudītu saistību starp vērtībām. Šajā gadījumā neviens nenosaka, kurš mainīgais ir atkarīgs. Var izrādīties, ka abu lielumu vērtība nosaka kādu citu faktoru.
- Lai atvasinātu vienādojumu. Šajā gadījumā jūs varat vienkārši aizstāt tajā skaitļus un uzzināt nezināmā mainīgā vērtības.
Vīrietis, kurš meklē cēloņsakarības
Apziņa ir sakārtota tā, ka mums noteikti ir jāizskaidro notikumi, kas notiek apkārt. Cilvēks vienmēr meklē saikni starp pasaules attēlu, kurā viņš dzīvo, un informāciju, ko viņš saņem. Bieži vien smadzenes rada kārtību no haosa. Viņš var viegli saskatīt cēloņsakarības tur, kur to nav. Zinātniekiem ir īpaši jāmācās pārvarēt šo tendenci. Spēja novērtēt attiecības starp datiem ir objektīvi būtiska akadēmiskajā karjerā.
Mediju neobjektivitāte
Apsveriet, kā korelācijas esamību var nepareizi interpretēt. Grupai slikti uzvedīgu britu studentu jautāja, vai viņu vecāki smēķē. Tad tests tika publicēts laikrakstā. Rezultāts parādīja spēcīgu korelāciju starp vecāku smēķēšanu un viņu bērnu likumpārkāpumiem. Profesors, kurš veica šo pētījumu, pat ieteica uz cigarešu paciņām ievietot brīdinājumu par to. Tomēr šim secinājumam ir vairākas problēmas. Pirmkārt, korelācija nenorāda, kurš no daudzumiem ir neatkarīgs. Tāpēc pilnīgi iespējams pieņemt, ka vecāku kaitīgo ieradumu izraisa bērnu nepaklausība. Otrkārt, nav iespējams droši apgalvot, ka abas problēmas nav radušās kāda trešā faktora dēļ. Piemēram, maznodrošinātām ģimenēm. Jāatzīmē pētījuma veicēja profesora sākotnējo secinājumu emocionālais aspekts. Viņš bija dedzīgs smēķēšanas pretinieks. Tāpēc nav pārsteidzoši, ka viņš šādi interpretēja sava pētījuma rezultātus.
secinājumus
Nepareizi interpretējot korelāciju kā cēloņsakarību starp diviem mainīgajiem lielumiem, var rasties apkaunojošas izpētes kļūdas. Problēma ir tā, ka tā atrodas pašā cilvēka apziņas kodolā. Daudzu mārketinga triku pamatā ir šī funkcija. Izpratne par atšķirību starp cēloņsakarību un korelāciju ļauj racionāli analizēt informāciju gan ikdienas dzīvē, gan profesionālajā karjerā.