Šta je korelacija u statistici. Koeficijent korelacije je karakteristika korelacionog modela. Kako protumačiti vrijednost Pearsonovog koeficijenta korelacije
![Šta je korelacija u statistici. Koeficijent korelacije je karakteristika korelacionog modela. Kako protumačiti vrijednost Pearsonovog koeficijenta korelacije](https://i2.wp.com/psyfactor.org/lib/i/Image45.gif)
» Statistika
Statistika i obrada podataka u psihologiji
(nastavak)
Korelaciona analiza
Prilikom studiranja korelacije pokušajte utvrditi postoji li veza između dva indikatora u istom uzorku (na primjer, između visine i težine djece ili između nivoa IQ i školski uspjeh) ili između dva različita uzorka (na primjer, kada se porede parovi blizanaca), i ako taj odnos postoji, da li je povećanje jednog pokazatelja praćeno povećanjem (pozitivna korelacija) ili smanjenjem (negativna korelacija) ostalo.
Drugim riječima, korelacijska analiza pomaže da se utvrdi da li je moguće predvidjeti moguće vrijednosti jednog indikatora, znajući vrijednost drugog.
Do sada, kada smo analizirali rezultate našeg iskustva u proučavanju efekata marihuane, namjerno smo zanemarivali takav pokazatelj kao što je vrijeme reakcije. U međuvremenu, bilo bi zanimljivo provjeriti postoji li veza između efikasnosti reakcija i njihove brzine. To bi, na primjer, omogućilo da se tvrdi da što je osoba sporija, to će njene akcije biti tačnije i djelotvornije i obrnuto.
U tu svrhu mogu se koristiti dvije različite metode: parametarska metoda izračunavanja Bravais-Pearsonovog koeficijenta (r) i izračunavanje Spearmanovog koeficijenta rang korelacije (r s), koji se primjenjuje na redne podatke, tj. je neparametarski. Međutim, hajde da prvo shvatimo šta je koeficijent korelacije.
Koeficijent korelacije
Koeficijent korelacije je vrijednost koja može varirati od +1 do -1. U slučaju potpune pozitivne korelacije, ovaj koeficijent je jednak plus 1, au slučaju potpune negativne korelacije je minus 1. Na grafu to odgovara pravoj liniji koja prolazi kroz tačke presjeka vrijednosti svakog para podataka:
Ako se ove tačke ne postavljaju u pravu liniju, već formiraju „oblak“, apsolutna vrijednost koeficijenta korelacije postaje manja od jedan i približava se nuli kako se oblak zaokružuje:
Ako je koeficijent korelacije 0, obje varijable su potpuno nezavisne jedna od druge.
U humanističkim naukama korelacija se smatra jakom ako je njen koeficijent veći od 0,60; ako prelazi 0,90, tada se korelacija smatra veoma jakom. Međutim, da bi se mogli izvući zaključci o odnosima između varijabli, veličina uzorka je od velike važnosti: što je uzorak veći, to je pouzdanija vrijednost dobijenog koeficijenta korelacije. Postoje tablice s kritičnim vrijednostima koeficijenata korelacije Bravais-Pearson i Spearman za različit broj stupnjeva slobode (jednako je broju parova minus 2, tj. n- 2). Samo ako su koeficijenti korelacije veći od ovih kritičnih vrijednosti mogu se smatrati pouzdanim. Dakle, da bi koeficijent korelacije od 0,70 bio pouzdan, u analizu treba uzeti najmanje 8 parova podataka ( h =n-2=6) pri izračunavanju r (vidi tabelu 4 u dodatku) i 7 parova podataka (h = n-2= 5) prilikom izračunavanja r s (tabela 5 u prilogu).
Još jednom želim da naglasim da je suština ova dva koeficijenta nešto drugačija. Negativan koeficijent r ukazuje da je efikasnost najčešće veća, što je brže vrijeme reakcije, dok je pri izračunavanju koeficijenta r s bilo potrebno provjeriti da li brži subjekti uvijek tačnije, a sporiji manje tačnije.
Bravais-Pearson koeficijent korelacije (r) - Ovo je parametarski indikator, za čije se izračunavanje upoređuju prosječna i standardna devijacija rezultata dva mjerenja. U ovom slučaju se koristi formula (može izgledati drugačije za različite autore)
gdje je Σ XY- zbir proizvoda podataka iz svakog para;
n je broj parova;
X - prosjek za datu varijablu x;
Y -
prosjek za varijabilne podatke Y
Sx- standardna devijacija za distribuciju X;
Sy- standardna devijacija za distribuciju at
Spearmanov koeficijent korelacije ranga ( rs ) - ovo je neparametarski indikator, uz pomoć kojeg pokušavaju otkriti odnos između rangova odgovarajućih veličina u dvije serije mjerenja.
Ovaj koeficijent je lakše izračunati, ali rezultati su manje tačni od korištenja r. To je zbog činjenice da se pri izračunavanju Spearmanovog koeficijenta koristi redoslijed podataka, a ne njihove kvantitativne karakteristike i intervali između klasa.
Činjenica je da kada se koriste koeficijent korelacije Spearmanovih rangova (r s), oni samo provjeravaju da li će rangiranje podataka za bilo koji uzorak biti isto kao u nizu drugih podataka za ovaj uzorak, parno vezanih za prvi (npr. , da li će biti isti „rangirani” od strane učenika i psihologije i matematike, ili čak i kod dva različita nastavnika psihologije?). Ako je koeficijent blizu +1, to znači da se oba niza praktično poklapaju, a ako je ovaj koeficijent blizu -1, možemo govoriti o potpunom inverznom odnosu.
Koeficijent rs izračunato prema formuli
gdje d je razlika između rangova vrijednosti konjugiranih karakteristika (bez obzira na njegov predznak) i broj parova.
Obično se ovaj neparametarski test koristi u slučajevima kada trebate izvući neke zaključke ne toliko o tome intervalima između podataka, koliko o njima činovi, kao i kada su krive distribucije previše iskrivljene i ne dozvoljavaju korištenje parametarskih kriterija kao što je koeficijent r (u ovim slučajevima može biti potrebno kvantitativne podatke pretvoriti u redne podatke).
Sažetak
Dakle, razmotrili smo različite parametarske i neparametarske statističke metode koje se koriste u psihologiji. Naš pregled je bio vrlo površan, a glavni zadatak mu je bio da čitatelju natjera da shvati da statistika nije toliko strašna kao što se čini i da zahtijeva uglavnom zdrav razum. Podsjećamo da su podaci o "iskustvu" kojima smo se ovdje bavili fiktivni i ne mogu poslužiti kao osnova za bilo kakve zaključke. Međutim, takav eksperiment bi bio vrijedan izvođenja. Budući da je za ovaj eksperiment odabrana čisto klasična tehnika, ista statistička analiza mogla bi se koristiti u mnogim različitim eksperimentima. U svakom slučaju, čini nam se da smo zacrtali neke glavne pravce koji bi mogli biti korisni onima koji ne znaju odakle početi statističku analizu rezultata.
Književnost
- Godefroy J.Šta je psihologija. - M., 1992.
- Chatillon G., 1977. Statistique en Sciences humaines, Trois-Rivieres, Ed. SMG.
- Gilbert N. 1978. Statistiques, Montreal, Ed. H.R.W.
- Moroney M.J., 1970. Comprendre la statistique, Verviers, Gerard et Cie.
- Siegel S., 1956. Non-parametric Statistic, New York, MacGraw-Hill Book Co.
Aplikacija za tabelarne proračune
Bilješke. 1) Za velike uzorke ili nivoe značajnosti manje od 0,05, pogledajte tabele u statističkim udžbenicima.
2) Tabele vrijednosti za druge neparametarske kriterije mogu se naći u posebnim smjernicama (vidi bibliografiju).
Tabela 1. Vrijednosti kriterija t Student | |
h | 0,05 |
1 | 6,31 |
2 | 2,92 |
3 | 2,35 |
4 | 2,13 |
5 | 2,02 |
6 | 1,94 |
7 | 1,90 |
8 | 1,86 |
9 | 1,83 |
10 | 1,81 |
11 | 1,80 |
12 | 1,78 |
13 | 1,77 |
14 | 1,76 |
15 | 1,75 |
16 | 1,75 |
17 | 1,74 |
18 | 1,73 |
19 | 1,73 |
20 | 1,73 |
21 | 1,72 |
22 | 1,72 |
23 | 1,71 |
24 | 1,71 |
25 | 1,71 |
26 | 1,71 |
27 | 1,70 |
28 | 1,70 |
29 | 1,70 |
30 | 1,70 |
40 | 1,68 |
¥ | 1,65 |
Tabela 2. Vrijednosti kriterija χ 2 | |
h | 0,05 |
1 | 3,84 |
2 | 5,99 |
3 | 7,81 |
4 | 9,49 |
5 | 11,1 |
6 | 12,6 |
7 | 14,1 |
8 | 15,5 |
9 | 16,9 |
10 | 18,3 |
Tabela 3. Pouzdane Z vrijednosti | |
R | Z |
0,05 | 1,64 |
0,01 | 2,33 |
Tabela 4. Pouzdane (kritične) vrijednosti r | ||
h =(N-2) | p= 0,05 (5%) | |
3 | 0,88 | |
4 | 0,81 | |
5 | 0,75 | |
6 | 0,71 | |
7 | 0,67 | |
8 | 0,63 | |
9 | 0,60 | |
10 | 0,58 | |
11 | 0.55 | |
12 | 0,53 | |
13 | 0,51 | |
14 | 0,50 | |
15 | 0,48 | |
16 | 0,47 | |
17 | 0,46 | |
18 | 0,44 | |
19 | 0,43 | |
20 | 0,42 |
Tabela 5. Pouzdane (kritične) vrijednosti r s | |
h =(N-2) | p = 0,05 |
2 | 1,000 |
3 | 0,900 |
4 | 0,829 |
5 | 0,714 |
6 | 0,643 |
7 | 0,600 |
8 | 0,564 |
10 | 0,506 |
12 | 0,456 |
14 | 0,425 |
16 | 0,399 |
18 | 0,377 |
20 | 0,359 |
22 | 0,343 |
24 | 0,329 |
26 | 0,317 |
28 | 0,306 |
Koeficijent korelacije je vrijednost koja može varirati od +1 do -1. U slučaju potpune pozitivne korelacije, ovaj koeficijent je jednak plus 1 (kažu da se povećanjem vrijednosti jedne varijable povećava vrijednost druge varijable), a kod potpune negativne korelacije - minus 1 (označava povratnu informaciju , odnosno kada se vrijednosti jedne varijable povećavaju, vrijednosti druge se smanjuju).
Primjer 1:
Grafikon zavisnosti stidljivosti i depresije. Kao što vidite, tačke (subjekti) nisu raspoređene nasumično, već se poređaju oko jedne linije i, gledajući ovu liniju, možemo reći da što je stidljivost izraženija kod osobe, to su te pojave depresivnije, tj. su međusobno povezani.
Primjer 2: Grafikon stidljivosti i društvenosti. Vidimo da kako stidljivost raste, društvenost se smanjuje. Njihov koeficijent korelacije je -0,43. Dakle, koeficijent korelacije veći od 0 do 1 ukazuje na direktno proporcionalnu vezu (što više ... više ...), a koeficijent od -1 do 0 označava obrnuto proporcionalnu vezu (što više ... to manje . ..)
Ako je koeficijent korelacije 0, obje varijable su potpuno nezavisne jedna od druge.
korelacija- ovo je odnos u kojem se uticaj pojedinih faktora pojavljuje samo kao trend (u prosjeku) uz masovno posmatranje stvarnih podataka. Primeri korelacione zavisnosti mogu biti zavisnost između veličine aktive banke i visine dobiti banke, rasta produktivnosti rada i radnog staža.
Koriste se dva sistema klasifikacije korelacija prema njihovoj snazi: opšti i partikularni.
Opšta klasifikacija korelacija: 1) jaka ili bliska sa koeficijentom korelacije r> 0,70 2) srednja na 0,500,70, a ne samo korelacija visokog nivoa značajnosti.U sljedećoj tabeli navedeni su nazivi koeficijenata korelacije za različite vrste skala.
Dihotomna skala (1/0) | Rang (redna) skala | ||
Dihotomna skala (1/0) | Pearsonov koeficijent asocijacije, Pearsonov koeficijent konjugacije četiri ćelije. | Biserijska korelacija | |
Rang (redna) skala | Rang-biserijska korelacija. | Spearmanov ili Kendallov koeficijent korelacije ranga. | |
Interval i apsolutna skala | Biserijska korelacija | Vrijednosti skale intervala se pretvaraju u rangove i koristi se koeficijent ranga | Pearson koeficijent korelacije (linearni koeficijent korelacije) |
At r=0 nema linearne korelacije. U ovom slučaju, srednje vrijednosti grupe varijabli poklapaju se sa njihovim općim srednjim vrijednostima, a linije regresije su paralelne sa koordinatnim osa.
Jednakost r=0 govori samo o odsustvu linearne korelacione zavisnosti (nekorelisane varijable), ali ne uopšte o odsustvu korelacije, a još više, statističke zavisnosti.
Ponekad je zaključak da nema korelacije važniji od prisustva jake korelacije. Nulta korelacija dve varijable može ukazivati na to da nema uticaja jedne varijable na drugu, pod uslovom da verujemo rezultatima merenja.
U SPSS-u: 11.3.2 Koeficijenti korelacije
Do sada smo saznali samo samu činjenicu postojanja statističke veze između dvije karakteristike. Zatim ćemo pokušati saznati koji se zaključci mogu izvući o snazi ili slabosti ove zavisnosti, kao io njenom obliku i smjeru. Kriterijumi za kvantificiranje odnosa između varijabli nazivaju se koeficijenti korelacije ili mjere povezanosti. Dvije varijable su u pozitivnoj korelaciji ako između njih postoji direktna, jednosmjerna veza. U jednosmjernom odnosu, male vrijednosti jedne varijable odgovaraju malim vrijednostima druge varijable, velike vrijednosti odgovaraju velikim. Dvije varijable su u negativnoj korelaciji ako između njih postoji inverzna veza. Kod višesmjernog odnosa, male vrijednosti jedne varijable odgovaraju velikim vrijednostima druge varijable i obrnuto. Vrijednosti koeficijenata korelacije su uvijek u rasponu od -1 do +1.
Spearmanov koeficijent se koristi kao koeficijent korelacije između varijabli koje pripadaju ordinalnoj skali, a Pirsonov koeficijent korelacije (moment proizvoda) se koristi za varijable koje pripadaju intervalnoj skali. U ovom slučaju treba napomenuti da se svaka dihotomna varijabla, odnosno varijabla koja pripada nominalnoj skali i ima dvije kategorije, može smatrati ordinalnom.
Prvo ćemo provjeriti postoji li korelacija između varijabli spola i psihe iz datoteke studium.sav. Pri tome vodimo računa da se dihotomna varijabla spol može smatrati ordinalnom varijablom. Uradite sljedeće:
Izaberite iz komandnog menija Analiza (Analiza) Deskriptivna statistika (Deskriptivna statistika) Unakrsne tabele... (Tabele nepredviđenih situacija)
· Premjestite varijablu spol na listu redova, a varijablu psihu na listu kolona.
· Kliknite na dugme Statistika.... U dijalogu Crosstabs: Statistics, označite polje Korelacije. Potvrdite svoj izbor dugmetom Nastavi.
· U dijalogu Crosstabs, zaustavite prikazivanje tabela tako što ćete potvrditi izbor u polju za potvrdu Supress tables. Kliknite na dugme OK.
Izračunat će se Spearman i Pearson koeficijenti korelacije, a njihova značajnost će se testirati:
/ SPSS 10
Zadatak broj 10 Korelaciona analiza
Koncept korelacije
Korelacija ili koeficijent korelacije je statistički pokazatelj vjerovatnoća odnose između dvije varijable mjerene na kvantitativnim skalama. Za razliku od funkcionalne veze, kojoj odgovara svaka vrijednost jedne varijable strogo definisano vrijednost druge varijable, verovatnoća veza karakterizira činjenica da svakoj vrijednosti jedne varijable odgovara skup vrijednosti Druga varijabla, primjer vjerovatnoće veze je odnos između visine i težine ljudi. Jasno je da ljudi različite težine mogu imati istu visinu i obrnuto.
Korelacija je vrijednost između -1 i +1 i označava se slovom r. Štoviše, ako je vrijednost bliža 1, to znači prisutnost jake veze, a ako je bliža 0, onda slabe. Vrijednost korelacije manja od 0,2 smatra se slabom korelacijom, veća od 0,5 - visokom. Ako je koeficijent korelacije negativan, to znači da postoji inverzna veza: što je veća vrijednost jedne varijable, to je niža vrijednost druge.
Ovisno o prihvaćenim vrijednostima koeficijenta r, mogu se razlikovati različite vrste korelacije:
Jaka pozitivna korelacija određena je vrijednošću r=1. Izraz "strogo" znači da je vrijednost jedne varijable jedinstveno određena vrijednostima druge varijable, a termin " pozitivno" - da kako se povećava vrijednost jedne varijable, povećava se i vrijednost druge varijable.
Stroga korelacija je matematička apstrakcija i gotovo se nikada ne pojavljuje u stvarnim istraživanjima.
pozitivna korelacija odgovara vrijednostima 0
Nedostatak korelacije je određena vrijednošću r=0. Koeficijent korelacije nula ukazuje da vrijednosti varijabli nisu ni na koji način povezane jedna s drugom.
Nedostatak korelacije H o : 0 r xy =0 formulisan kao odraz null hipoteze u korelacionoj analizi.
negativna korelacija: -1
Jaka negativna korelacija određena vrijednošću r= -1. Ona je, kao i stroga pozitivna korelacija, apstrakcija i ne nalazi izraz u praktičnim istraživanjima.
Tabela 1
Vrste korelacije i njihove definicije
Način izračunavanja koeficijenta korelacije ovisi o vrsti skale na kojoj se mjere vrijednosti varijable.
Koeficijent korelacije rPearson je glavni i može se koristiti za varijable sa nominalnim i djelimično uređenim intervalnim skalama, distribucija vrijednosti preko kojih odgovara normalnoj (korelacija momenata proizvoda). Pearsonov koeficijent korelacije daje prilično precizne rezultate iu slučajevima abnormalnih distribucija.
Za distribucije koje nisu normalne, poželjno je koristiti koeficijente korelacije ranga Spearman i Kendall. Oni su rangirani jer program unaprijed rangira korelirane varijable.
SPSS program izračunava r-Spearmanovu korelaciju na sljedeći način: prvo se varijable pretvaraju u rangove, a zatim se na rangove primjenjuje Pirsonova formula.
Korelacija koju je predložio M. Kendall zasniva se na ideji da se smjer veze može procijeniti poređenjem subjekata u parovima. Ako se za par subjekata promjena u X poklapa u smjeru s promjenom u Y poklapa, onda to ukazuje na pozitivan odnos. Ako se ne poklapa, onda o negativnom odnosu. Ovaj koeficijent koriste uglavnom psiholozi koji rade sa malim uzorcima. Pošto sociolozi rade sa velikim nizovima podataka, teško je sortirati parove, identifikovati razliku u relativnim frekvencijama i inverzije svih parova subjekata u uzorku. Najčešći je koeficijent. Pearson.
Budući da je koeficijent korelacije rPearson glavni i da se može koristiti (sa određenom greškom u zavisnosti od vrste skale i nivoa abnormalnosti u distribuciji) za sve varijable mjerene na kvantitativnim skalama, razmotrićemo primjere njegove upotrebe i uporediti rezultati dobijeni sa rezultatima merenja korišćenjem drugih koeficijenata korelacije.
Formula za izračunavanje koeficijenta r- Pearson:
r xy = ∑ (Xi-Xav)∙(Yi-Yav) / (N-1)∙σ x ∙σ y ∙
Gdje je: Xi, Yi- vrijednosti dvije varijable;
Xav, Yav - prosječne vrijednosti dvije varijable;
σ x , σ y su standardne devijacije,
N je broj zapažanja.
Parne korelacije
Na primjer, željeli bismo saznati kako su odgovori između različitih tipova tradicionalnih vrijednosti u korelaciji u idejama učenika o idealnom mjestu rada (varijable: a9.1, a9.3, a9.5, a9.7) , a zatim o omjeru liberalnih vrijednosti (a9 .2, a9.4, a9.6, a9.8). Ove varijable se mjere na skali od 5 članova.
Koristimo proceduru: "Analiza", "Korelacije", "Upareno". Podrazumevano, koeficijent Pearson je postavljen u dijaloškom okviru. Koristimo koeficijent Pearson
Testirane varijable se prenose u prozor za izbor: a9.1, a9.3, a9.5, a9.7
Pritiskom na OK dobijamo proračun:
Korelacije
a9.1.t. Koliko je važno imati dovoljno vremena za porodicu i lični život? |
Pirsonova korelacija |
||||
vrijednost (dvostrano) |
|||||
a9.3.t. Koliko je važno ne plašiti se gubitka posla? |
Pirsonova korelacija |
||||
vrijednost (dvostrano) |
|||||
a9.5.t. Koliko je važno imati takvog šefa koji će se konsultovati sa vama prilikom donošenja ove ili one odluke? |
Pirsonova korelacija |
||||
vrijednost (dvostrano) |
|||||
a9.7.t. Koliko je važno raditi u dobro uigranom timu, osjećati se kao njegov dio? |
Pirsonova korelacija |
||||
vrijednost (dvostrano) |
|||||
** Korelacija je značajna na nivou od 0,01 (dvostrano).
Tabela kvantitativnih vrijednosti konstruirane korelacijske matrice
Parcijalne korelacije:
Prvo, napravimo parnu korelaciju između ove dvije varijable:
Korelacije |
|||
c8. Osjećajte se blisko sa onima koji žive u vašoj blizini, susjedima |
Pirsonova korelacija |
||
vrijednost (dvostrano) |
|||
c12. Osjećati se bliskim njihovoj porodici |
Pirsonova korelacija |
||
vrijednost (dvostrano) |
|||
**. Korelacija je značajna na nivou od 0,01 (dvostrano). |
Zatim koristimo proceduru za konstruisanje parcijalne korelacije: "Analiza", "Korelacije", "Parcijalna".
Pretpostavimo da će vrijednost “Važno je samostalno odrediti i promijeniti redoslijed svog rada” u odnosu na naznačene varijable biti odlučujući faktor, pod čijim će se utjecajem prethodno identificirani odnos nestati ili pokazati da je od malog značaja. .
Korelacije |
||||
Izuzete varijable |
c8. Osjećajte se blisko sa onima koji žive u vašoj blizini, susjedima |
c12. Osjećati se bliskim njihovoj porodici |
||
c16. Osjećajte se blisko sa ljudima koji imaju isto bogatstvo kao i vi |
c8. Osjećajte se blisko sa onima koji žive u vašoj blizini, susjedima |
Korelacija |
||
Značaj (dvostrano) |
||||
c12. Osjećati se bliskim njihovoj porodici |
Korelacija |
|||
Značaj (dvostrano) |
||||
Kao što se vidi iz tabele, pod uticajem kontrolne varijable odnos je blago opao: sa 0,120 na 0,102. ostaje dovoljno visoka i omogućava opovrgavanje nulte hipoteze sa nultom greškom.
Koeficijent korelacije
Najtačniji način za određivanje čvrstoće i prirode korelacije je pronalaženje koeficijenta korelacije. Koeficijent korelacije je broj određen formulom:
gdje je r xy koeficijent korelacije;
x i -vrijednosti prve karakteristike;
i -vrijednosti druge karakteristike;
Aritmetička sredina vrijednosti prve karakteristike
Aritmetička sredina vrijednosti druge karakteristike
Da bismo koristili formulu (32), konstruisali smo tabelu koja će obezbediti neophodan redosled u pripremi brojeva za pronalaženje brojnika i nazivnika koeficijenta korelacije.
Kao što se može vidjeti iz formule (32), slijed radnji je sljedeći: nalazimo aritmetičku sredinu oba znaka x i y, nalazimo razliku između vrijednosti znaka i njegovog prosjeka (h i - ) i y i - ), tada nalazimo njihov proizvod (h i - ) ( y i - ) – zbir potonjeg daje brojnik koeficijenta korelacije. Da bi se našao njegov nazivnik, potrebno je kvadrirati razlike (x i -) i (y i -), pronaći njihove sume i izvući kvadratni korijen iz njihovog proizvoda.
Tako na primjer 31, pronalaženje koeficijenta korelacije u skladu sa formulom (32) može se predstaviti na sljedeći način (tabela 50).
Rezultirajući broj koeficijenta korelacije omogućava utvrđivanje prisutnosti, bliskosti i prirode odnosa.
1. Ako je koeficijent korelacije nula, nema veze između karakteristika.
2. Ako je koeficijent korelacije jednak jedan, odnos između karakteristika je toliki da se pretvara u funkcionalan.
3. Apsolutna vrijednost koeficijenta korelacije ne prelazi interval od nule do jedan:
Ovo omogućava fokusiranje na čvrstoću veze: što je koeficijent bliži nuli, to je veza slabija, a što je bliže jedinici, to je veza bliža.
4. Znak koeficijenta korelacije "plus" znači direktnu korelaciju, znak "minus" znači suprotno.
Table 50
x i | i | (h i - ) | (y i - ) | (x i - )(y i - ) | (h i - )2 | (y i - )2 |
14,00 | 12,10 | -1,70 | -2,30 | +3,91 | 2,89 | 5,29 |
14,20 | 13,80 | -1,50 | -0,60 | +0,90 | 2,25 | 0,36 |
14,90 | 14,20 | -0,80 | -0,20 | +0,16 | 0,64 | 0,04 |
15,40 | 13,00 | -0,30 | -1,40 | +0,42 | 0,09 | 1,96 |
16,00 | 14,60 | +0,30 | +0,20 | +0,06 | 0,09 | 0,04 |
17,20 | 15,90 | +1,50 | +2,25 | 2,25 | ||
18,10 | 17,40 | +2,40 | +2,00 | +4,80 | 5,76 | 4,00 |
109,80 | 101,00 | 12,50 | 13,97 | 13,94 |
Dakle, koeficijent korelacije izračunat u primjeru 31 je r xy = +0,9. nam omogućava da izvučemo sljedeće zaključke: postoji korelacija između veličine mišićne snage desne i lijeve ruke kod proučavanih školaraca (koeficijent r xy = + 0,9 nije nula), odnos je vrlo blizak (koeficijent r xy = + 0,9 je blizu jedinice), korelacija je direktna (koeficijent r xy = +0,9 je pozitivan), tj. sa povećanjem mišićne snage jedne ruke, povećava se snaga druge ruke.
Prilikom izračunavanja koeficijenta korelacije i korištenja njegovih svojstava treba uzeti u obzir da zaključci daju ispravne rezultate kada su karakteristike normalno raspoređene i kada se razmatra odnos između velikog broja vrijednosti oba svojstva.
U razmatranom primjeru 31 analizirano je samo 7 vrijednosti obje karakteristike, što, naravno, nije dovoljno za ovakva istraživanja. Ovdje još jednom podsjećamo da su primjeri, općenito u ovoj knjizi, a posebno u ovom poglavlju, prirode metoda ilustriranja, a ne detaljnog prikaza bilo kakvih naučnih eksperimenata. Kao rezultat toga, uzima se u obzir mali broj vrijednosti karakteristika, mjerenja se zaokružuju - sve se to radi kako se ideja metode ne bi zamaglila glomaznim proračunima.
Posebnu pažnju treba obratiti na suštinu odnosa koji se razmatra. Koeficijent korelacije ne može dovesti do ispravnih rezultata studije ako se analiza odnosa između obilježja vrši formalno. Vratimo se na primjer 31. Oba razmatrana znaka su bile vrijednosti mišićne snage desne i lijeve ruke. Zamislimo da pod osobinom x i u primjeru 31 (14.0; 14.2; 14.9... ...18.1) podrazumijevamo dužinu nasumično ulovljene ribe u centimetrima, a pod osobinom y i (12.1 ; 13.8; 14.2 ... ... 17.4) - težina instrumenata u laboratoriji u kilogramima. Formalno, koristeći aparat za proračune za pronalaženje koeficijenta korelacije i u ovom slučaju dobijajući i r xy =+0>9, trebali smo zaključiti da postoji bliska veza direktne prirode između dužine ribe i težine ribe. instrumente. Očigledna je apsurdnost takvog zaključka.
Da bi se izbjegao formalni pristup korištenju koeficijenta korelacije, treba koristiti bilo koju drugu metodu – matematičku, logičku, eksperimentalnu, teorijsku – da se utvrdi mogućnost korelacije između znakova, odnosno da se otkrije organsko jedinstvo znakova. Tek tada se može početi koristiti korelacionom analizom i utvrditi veličinu i prirodu odnosa.
U matematičkoj statistici postoji i koncept višestruka korelacija- Odnosi između tri ili više karakteristika. U tim slučajevima se koristi višestruki koeficijent korelacije, koji se sastoji od gore opisanih koeficijenata parne korelacije.
Na primjer, koeficijent korelacije tri znaka - x í , y í , z í - je:
gdje je R xyz -višestruki koeficijent korelacije koji izražava kako karakteristika x i zavisi od karakteristika y i i z i ;
r xy -koeficijent korelacije između karakteristika x i i y i ;
r xz - koeficijent korelacije između karakteristika Xi i Zi;
r yz - koeficijent korelacije između karakteristika y i , z i
Analiza korelacije je:
Korelaciona analizaKorelacija- statistički odnos dvije ili više slučajnih varijabli (ili varijabli koje se kao takve mogu smatrati sa nekim prihvatljivim stepenom tačnosti). Istovremeno, promjene u jednoj ili više ovih veličina dovode do sistematske promjene druge ili drugih veličina. Koeficijent korelacije služi kao matematička mjera korelacije dvije slučajne varijable.
Korelacija može biti pozitivna i negativna (moguće je i da ne postoji statistička veza - na primjer, za nezavisne slučajne varijable). negativna korelacija - korelacija, u kojoj je povećanje jedne varijable povezano sa smanjenjem druge varijable, dok je koeficijent korelacije negativan. pozitivna korelacija - korelacija u kojoj je povećanje jedne varijable povezano sa povećanjem druge varijable, dok je koeficijent korelacije pozitivan.
autokorelacija - statistički odnos između slučajnih varijabli iz iste serije, ali uzetih sa pomakom, na primjer, za slučajni proces - sa pomakom u vremenu.
Metoda obrade statističkih podataka, koja se sastoji u proučavanju koeficijenata (korelacija) između varijabli, naziva se korelacione analize.
Koeficijent korelacije
Koeficijent korelacije ili koeficijent korelacije para u teoriji vjerovatnoće i statistici, ovo je indikator prirode promjene dvije slučajne varijable. Koeficijent korelacije je označen latiničnim slovom R i može imati vrijednosti između -1 i +1. Ako je vrijednost modula bliža 1, to znači prisutnost jake veze (s koeficijentom korelacije jednakim jedan, govore o funkcionalnoj vezi), a ako je bliža 0, onda slaba.
Pearsonov koeficijent korelacije
Za metričke veličine koristi se Pearsonov koeficijent korelacije, čiju je tačnu formulu uveo Francis Galton:
Neka X,Y- dvije slučajne varijable definirane na istom prostoru vjerovatnoće. Tada je njihov koeficijent korelacije dan formulom:
![](https://i0.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
![](https://i1.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
gdje je cov kovarijansa, a D varijansa, ili ekvivalentno,
,gdje simbol označava matematičko očekivanje.
Da biste grafički prikazali takav odnos, možete koristiti pravougaoni koordinatni sistem sa osama koje odgovaraju obe varijable. Svaki par vrijednosti označen je određenim simbolom. Takav dijagram se naziva "scatterplot".
Metoda izračunavanja koeficijenta korelacije zavisi od vrste skale na koju se varijable odnose. Dakle, za mjerenje varijabli intervalnim i kvantitativnim skalama potrebno je koristiti Pirsonov koeficijent korelacije (korelacija momenata proizvoda). Ako barem jedna od dvije varijable ima ordinalnu skalu ili nije normalno raspoređena, mora se koristiti Spearmanova korelacija ranga ili Kendalov τ (tau). U slučaju kada je jedna od dvije varijable dihotomna, koristi se točkasta dvoserija korelacija, a ako su obje varijable dihotomne koristi se korelacija sa četiri polja. Izračunavanje koeficijenta korelacije između dvije ne-dihotomne varijable ima smisla samo ako je odnos između njih linearan (jednosmjeran).
Kendellov koeficijent korelacije
Koristi se za mjerenje međusobnog poremećaja.
Spearmanov koeficijent korelacije
Svojstva koeficijenta korelacije
- Nejednakost Cauchy - Bunyakovsky:
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
Korelaciona analiza
Korelaciona analiza- način obrade statističkih podataka koji se sastoji u proučavanju koeficijenata ( korelacije) između varijabli. U ovom slučaju, koeficijenti korelacije između jednog para ili više parova karakteristika se upoređuju kako bi se uspostavili statistički odnosi između njih.
Target korelacione analize- dati neke informacije o jednoj varijabli uz pomoć druge varijable. U slučajevima kada je moguće postići cilj, kažemo da su varijable korelirati. U svom najopćenitijem obliku, usvajanje hipoteze o prisutnosti korelacije znači da će se promjena vrijednosti varijable A dogoditi istovremeno sa proporcionalnom promjenom vrijednosti B: ako se obje varijable povećaju, tada korelacija je pozitivna ako se jedna varijabla povećava, a druga smanjuje, korelacija je negativna.
Korelacija odražava samo linearnu zavisnost veličina, ali ne odražava njihovu funkcionalnu povezanost. Na primjer, ako izračunamo koeficijent korelacije između vrijednosti A = sin(x) i B = cos(x), tada će biti blizu nule, tj. nema zavisnosti između veličina. U međuvremenu, veličine A i B su očigledno funkcionalno povezane u skladu sa zakonom sin 2(x) + cos 2(x) = 1.
Ograničenja korelacione analize
![](https://i1.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
![](https://i0.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
- Primjena je moguća ako postoji dovoljan broj slučajeva za proučavanje: za određenu vrstu koeficijenta korelacije on se kreće od 25 do 100 parova opservacija.
- Drugo ograničenje proizlazi iz hipoteze korelacione analize, koja uključuje linearna zavisnost varijabli. U mnogim slučajevima, kada se pouzdano zna da zavisnost postoji, korelaciona analiza možda neće dati rezultate jednostavno zato što je zavisnost nelinearna (izražena, na primjer, kao parabola).
- Sama po sebi činjenica korelacije ne daje osnova da se tvrdi koja od varijabli prethodi ili uzrokuje promjene, ili da su varijable općenito uzročno povezane jedna s drugom, na primjer, zbog djelovanja trećeg faktora.
Područje primjene
Ova metoda obrade statističkih podataka veoma je popularna u ekonomiji i društvenim naukama (posebno u psihologiji i sociologiji), iako je obim primene koeficijenata korelacije širok: kontrola kvaliteta industrijskih proizvoda, metalurgija, poljoprivredna hemija, hidrobiologija, biometrija, i drugi.
Popularnost metode je posljedica dvije tačke: koeficijente korelacije je relativno lako izračunati, njihova primjena ne zahtijeva posebnu matematičku obuku. U kombinaciji sa lakoćom interpretacije, lakoća primjene koeficijenta dovela je do njegove široke upotrebe u oblasti statističke analize podataka.
lažna korelacija
Često primamljiva jednostavnost korelacione studije podstiče istraživača da izvuče lažne intuitivne zaključke o postojanju uzročne veze između parova osobina, dok koeficijenti korelacije uspostavljaju samo statističke odnose.
U savremenoj kvantitativnoj metodologiji društvenih nauka, zapravo, došlo je do napuštanja pokušaja da se empirijskim metodama uspostave uzročne veze između posmatranih varijabli. Stoga, kada istraživači u društvenim naukama govore o uspostavljanju odnosa između varijabli koje proučavaju, implicira se ili opšta teorijska pretpostavka ili statistička zavisnost.
vidi takođe
- Funkcija autokorelacije
- Funkcija unakrsne korelacije
- kovarijansa
- Koeficijent determinacije
- Regresiona analiza
Wikimedia fondacija. 2010.
Različite karakteristike mogu biti povezane.
Postoje 2 vrste veze između njih:
- funkcionalan;
- korelacija.
Korelacija prevedeno na ruski - ništa više od veze.
U slučaju korelacije, postoji korespondencija nekoliko vrijednosti jednog atributa s nekoliko vrijednosti drugog atributa. Kao primjere možemo uzeti u obzir utvrđene korelacije između:
- dužina šapa, vrata, kljuna kod ptica kao što su čaplje, ždralovi, rode;
- indikatori telesne temperature i otkucaja srca.
Za većinu biomedicinskih procesa prisustvo ove vrste povezanosti je statistički dokazano.
Statističke metode omogućavaju utvrđivanje činjenice postojanja međuzavisnosti karakteristika. Upotreba posebnih proračuna za to dovodi do uspostavljanja koeficijenata korelacije (mjere povezanosti).
Takvi proračuni se nazivaju korelacione analize. Provodi se kako bi se potvrdila zavisnost 2 varijable (slučajne varijable) jedna o drugoj, što je izraženo koeficijentom korelacije.
Korištenje metode korelacije nam omogućava da riješimo nekoliko problema:
- identificirati odnos između analiziranih parametara;
- poznavanje prisutnosti korelacije omogućava rješavanje problema predviđanja. Dakle, postoji realna mogućnost da se predvidi ponašanje parametra na osnovu analize ponašanja drugog koreliranog parametra;
- klasifikacija zasnovana na izboru osobina nezavisnih jedna od druge.
Za varijable:
- u odnosu na ordinalnu skalu izračunava se Spearmanov koeficijent;
- vezano za intervalnu skalu - Pirsonov koeficijent.
Ovo su najčešće korišteni parametri, ali postoje i drugi.
Vrijednost koeficijenta može se izraziti i pozitivno i negativno.
U prvom slučaju, s povećanjem vrijednosti jedne varijable, uočava se povećanje druge. Sa negativnim koeficijentom, obrazac je obrnut.
Čemu služi koeficijent korelacije?
Slučajne varijable povezane jedna s drugom mogu imati potpuno drugačiju prirodu ove veze. Neće nužno biti funkcionalan, u slučaju kada postoji direktna veza između veličina. Najčešće na obje veličine utiče čitav niz različitih faktora, u slučajevima kada su zajedničke za obje veličine, uočava se formiranje povezanih obrazaca.
To znači da statistički dokazana činjenica postojanja veze između veličina nije potvrda da je uzrok uočenih promjena utvrđen. Po pravilu, istraživač zaključuje da postoje dvije međusobno povezane posljedice.
Svojstva koeficijenta korelacije
Ova statistika ima sljedeća svojstva:
- vrijednost koeficijenta se kreće od -1 do +1. Što je bliže ekstremnim vrijednostima, to je jača pozitivna ili negativna veza između linearnih parametara. U slučaju nulte vrijednosti, govorimo o odsustvu korelacije između karakteristika;
- pozitivna vrijednost koeficijenta ukazuje da se u slučaju povećanja vrijednosti jednog atributa uočava povećanje drugog (pozitivna korelacija);
- negativna vrijednost - u slučaju povećanja vrijednosti jednog atributa, uočava se smanjenje drugog (negativna korelacija);
- približavanje vrijednosti indikatora ekstremnim tačkama (bilo -1 ili +1) ukazuje na prisustvo vrlo jake linearne veze;
- indikatori osobina se mogu mijenjati sa konstantnom vrijednošću koeficijenta;
- koeficijent korelacije je bezdimenzionalna veličina;
- prisustvo korelacije nije obavezna potvrda uzročne veze.
Vrijednosti koeficijenta korelacije
Jačina korelacije može se okarakterizirati pribjegavanjem Cheldok skali, u kojoj kvalitativna karakteristika odgovara određenoj brojčanoj vrijednosti.
U slučaju pozitivne korelacije na vrijednosti:
- 0-0,3 - korelacija je vrlo slaba;
- 0,3-0,5 - slabo;
- 0,5-0,7 - srednja čvrstoća;
- 0,7-0,9 - visoka;
- 0,9-1 - vrlo visoka snaga korelacije.
Skala se može koristiti i za negativnu korelaciju. U ovom slučaju, kvalitativne karakteristike zamjenjuju se suprotnim.
Možete koristiti pojednostavljenu Cheldokovu skalu, u kojoj se razlikuju samo 3 gradacije jačine korelacije:
- veoma jak - indikatori ± 0,7 - ± 1;
- prosjek - pokazatelji ± 0,3 - ± 0,699;
- vrlo slab - indikatori 0 - ± 0,299.
Ovaj statistički indikator omogućava ne samo testiranje pretpostavke o postojanju linearne veze između karakteristika, već i utvrđivanje njegove snage.
Vrste koeficijenata korelacije
Koeficijenti korelacije se mogu klasificirati prema predznaku i vrijednosti:
- pozitivno;
- null;
- negativan.
U zavisnosti od analiziranih vrednosti, izračunava se koeficijent:
- Pearson;
- Spearman;
- Kendala;
- Fechner znakovi;
- podudarnost ili korelacija višestrukog ranga.
Pearsonov koeficijent korelacije koristi se za uspostavljanje direktnih veza između apsolutnih vrijednosti varijabli. U ovom slučaju, distribucije obje serije varijabli trebale bi se približiti normalnoj. Varijable koje se porede treba da se razlikuju za isti broj različitih karakteristika. Skala koja predstavlja varijable mora biti ili intervalna skala ili skala omjera.
- precizno utvrđivanje jačine korelacije;
- poređenje kvantitativnih karakteristika.
Postoji nekoliko nedostataka korištenja Pearsonovog koeficijenta linearne korelacije:
- metoda je nestabilna u slučaju odstupanja numeričkih vrijednosti;
- pomoću ove metode moguće je odrediti jačinu korelacije samo za linearnu vezu, a za druge vrste međusobnih odnosa varijabli treba koristiti metode regresione analize.
Korelacija ranga određena je Spearmanovom metodom, koja omogućava statističko proučavanje odnosa između pojava. Zahvaljujući ovom koeficijentu izračunava se stvarni stepen paralelizma dva kvantitativno izražena niza karakteristika, a takođe se procenjuje bliskost identifikovane veze.
- ne zahteva tačnu definiciju vrednosti korelacione snage;
- upoređeni indikatori imaju i kvantitativne i atributivne vrijednosti;
- poređenje redova karakteristika sa otvorenim varijantama vrednosti.
Spearmanova metoda se odnosi na metode neparametarske analize, tako da nema potrebe provjeravati normalnost raspodjele karakteristika. Osim toga, omogućava vam da uporedite indikatore izražene na različitim skalama. Na primjer, poređenje vrijednosti broja crvenih krvnih zrnaca u određenom volumenu krvi (kontinuirana skala) i stručna procjena, izražena u bodovima (redna skala).
Na efikasnost metode negativno utiče velika razlika između vrednosti upoređenih vrednosti. Metoda je također neefikasna u slučajevima kada je izmjerena vrijednost karakterizirana neravnomjernom raspodjelom vrijednosti.
Korak po korak izračunavanje koeficijenta korelacije u Excel-u
Izračunavanje koeficijenta korelacije uključuje sekvencijalno izvršavanje niza matematičkih operacija.
Gornja formula za izračunavanje Pearsonovog koeficijenta pokazuje koliko je ovaj proces naporan ako se radi ručno.
Korišćenje mogućnosti Excella ponekad ubrzava proces pronalaženja koeficijenta.
Dovoljno je slijediti jednostavan algoritam radnji:
- uvođenje osnovnih informacija - kolona od x vrijednosti i kolona od y vrijednosti;
- u alatima se bira i otvara kartica Formule;
- na kartici koja se otvori odaberite "Insert fx function";
- u dijaloškom okviru koji se otvara odabrana je statistička funkcija "Correl", koja vam omogućava da izračunate koeficijent korelacije između 2 niza podataka;
- podaci se unose u prozor koji se otvara: niz 1 - raspon vrijednosti kolone x (podaci moraju biti odabrani), niz 2 - raspon vrijednosti kolone y;
- pritisnete tipku „OK“, rezultat izračunavanja koeficijenta se pojavljuje u redu „vrijednost“;
- zaključak o postojanju korelacije između 2 skupa podataka i njegove snage.
Korelacioni model (CM) je računski program koji daje matematičku jednačinu u kojoj se rezultirajući indikator kvantificira ovisno o jednom ili više indikatora.
yx \u003d ao + a1x1
gdje je: y - pokazatelj učinka, u zavisnosti od faktora x;
x - faktor faktora;
a1 - parametar KM, koji pokazuje koliko će se efektivni indikator y promijeniti kada se faktor x promijeni za jedan, ako u isto vrijeme svi ostali faktori koji utiču na y ostanu nepromijenjeni;
ao - parametar KM, koji pokazuje uticaj svih ostalih faktora na efektivni indikator y, osim predznaka faktora x
Prilikom izbora efektivnih i faktorskih indikatora modela potrebno je uzeti u obzir činjenicu da je efektivni indikator u lancu uzročno-posledičnih veza na višem nivou od faktorskih indikatora.
Karakteristike korelacionog modela
Nakon izračunavanja parametara korelacionog modela, izračunava se koeficijent korelacije.
p - koeficijent korelacije para, -1 ≤ p ≤ 1, pokazuje jačinu i pravac uticaja faktorskog indikatora na efektivni. Što je bliže 1, veza je jača, što je bliža 0, to je veza slabija. Ako je koeficijent korelacije pozitivan, onda je veza direktna, a ako je negativna, inverzna.
Formula koeficijenta korelacije: pxy \u003d (xy-x * 1 / y) / eh * eu
ex=xx2-(x)2 ; eu=y2-(y)2
Ako je CM linearan multifaktorski, koji ima oblik:
yx \u003d ao + a1x1 + a2x2 + ... + axp
tada se za to izračunava koeficijent višestruke korelacije.
0 ≤ R ≤ 1 i pokazuje jačinu uticaja svih faktorskih indikatora uzetih zajedno na efektivni.
P \u003d 1- ((uh-uy) 2 / (yi - usr) 2)
Gdje je: uh - efektivni indikator - izračunata vrijednost;
ui - stvarna vrijednost;
usr - stvarna vrijednost, prosjek.
Izračunata vrijednost yx dobiva se kao rezultat zamjene u korelacijski model umjesto x1, x2, itd. njihove stvarne vrednosti.
Za jednofaktorske i višefaktorske nelinearne modele izračunava se korelacijski omjer:
1 ≤ m ≤ 1;
Smatra se da je odnos između efektivnih i faktorskih indikatora uključenih u model slab ako je vrijednost koeficijenta bliskosti veze (m) unutar 0-0,3; ako je 0,3-0,7 - nepropusnost veze je prosječna; iznad 0,7-1 - veza je jaka.
Pošto su koeficijent korelacije (upareni) p, koeficijent korelacije (višestruki) P, korelacijski odnos m su vjerovatnoće vrijednosti, onda se za njih izračunavaju koeficijenti značajnosti (utvrđeni iz tabela). Ako su ovi koeficijenti veći od njihove tabelarne vrijednosti, onda su koeficijenti bliskosti povezanosti značajni razlozi. Ako su koeficijenti značajnosti nepropusnosti veze manji od tabelarnih vrijednosti, ili ako je sam koeficijent povezanosti manji od 0,7, tada u model nisu uključeni svi faktorski pokazatelji koji značajno utiču na rezultat.
Koeficijent determinacije jasno pokazuje procenat faktorskih indikatora uključenih u model koji određuju formiranje rezultata.
Ako je koeficijent determinacije veći od 50, tada model adekvatno opisuje proces koji se proučava, ako je manji od 50, potrebno je vratiti se na prvu fazu izgradnje i revidirati izbor faktorskih indikatora za uključivanje u model.
Fišerov koeficijent ili Fišerov kriterijum karakteriše efektivnost modela u celini. Ako izračunata vrijednost koeficijenta prelazi vrijednost u tabeli, tada je izgrađeni model pogodan za analizu, kao i za planiranje indikatora, proračuna za budućnost. Približna tablična vrijednost \u003d 1.5. Ako je izračunata vrijednost manja od vrijednosti u tabeli, potrebno je prvo izgraditi model, uključujući faktore koji značajno utiču na rezultat. Pored efektivnosti modela u cjelini, svaki koeficijent regresije utiče na materijalnost. Ako je izračunata vrijednost ovog koeficijenta premašila tabelarnu vrijednost, tada će koeficijent regresije biti značajan, ako je manji, tada se faktorski indikator za koji se izračunava ovaj koeficijent uklanja iz uzorka, proračuni počinju ispočetka, ali bez ovog faktora .
Koeficijent korelacije je stepen povezanosti između dvije varijable. Njegov proračun daje ideju da li postoji veza između dva skupa podataka. Za razliku od regresije, korelacija ne dozvoljava predviđanje vrijednosti. Međutim, izračunavanje koeficijenta je važan korak u preliminarnoj statističkoj analizi. Na primjer, utvrdili smo da je koeficijent korelacije između nivoa direktnih stranih investicija i rasta BDP-a visok. To nam daje ideju da je za osiguranje prosperiteta potrebno stvoriti povoljnu klimu posebno za strane poduzetnike. Na prvi pogled ne tako očigledan zaključak!
Korelacija i uzročnost
Možda ne postoji niti jedna oblast statistike koja bi bila tako čvrsto utemeljena u našim životima. Koeficijent korelacije se koristi u svim oblastima javnog znanja. Njegova glavna opasnost leži u činjenici da se često nagađa o njegovim visokim vrijednostima kako bi se ljudi uvjerili i natjerali da povjeruju u neke zaključke. Međutim, u stvari, jaka korelacija uopće ne ukazuje na uzročnu vezu između količina.
Koeficijent korelacije: Pirsonova i Spirmanova formula
Postoji nekoliko glavnih indikatora koji karakterišu odnos između dvije varijable. Istorijski gledano, prvi je Pirsonov linearni koeficijent korelacije. Polaže se u školi. Razvili su ga K. Pearson i J. Yule na osnovu rada Fr. Galton. Ovaj koeficijent vam omogućava da vidite odnos između racionalnih brojeva koji se racionalno mijenjaju. Uvijek je veći od -1 i manji od 1. Negativan broj ukazuje na obrnuto proporcionalnu vezu. Ako je koeficijent jednak nuli, onda nema veze između varijabli. Jednako pozitivnom broju - postoji direktno proporcionalna veza između proučavanih veličina. Spearmanov koeficijent korelacije ranga omogućava pojednostavljenje proračuna konstruiranjem hijerarhije varijabilnih vrijednosti.
Odnosi između varijabli
Korelacija pomaže da se odgovori na dva pitanja. Prvo, da li je odnos između varijabli pozitivan ili negativan. Drugo, koliko je jaka ovisnost. Korelaciona analiza je moćan alat za dobijanje ovih važnih informacija. Lako je uočiti da prihodi i rashodi domaćinstava rastu i padaju proporcionalno. Takav odnos se smatra pozitivnim. Naprotiv, kada cijena proizvoda raste, potražnja za njim opada. Takav odnos se naziva negativnim. Vrijednosti koeficijenta korelacije su između -1 i 1. Nula znači da ne postoji veza između proučavanih vrijednosti. Što je indikator bliži ekstremnim vrijednostima, to je jača veza (negativna ili pozitivna). O odsustvu zavisnosti svjedoči koeficijent od -0,1 do 0,1. Mora se shvatiti da takva vrijednost samo ukazuje na odsustvo linearnog odnosa.
Karakteristike aplikacije
Upotreba oba indikatora podliježe određenim pretpostavkama. Prvo, prisustvo jake veze ne određuje činjenicu da jedna vrijednost određuje drugu. Možda postoji treća veličina koja definira svaku od njih. Drugo, visok Pearsonov koeficijent korelacije ne ukazuje na uzročnu vezu između proučavanih varijabli. Treće, pokazuje isključivo linearan odnos. Korelacija se može koristiti za procjenu značajnih kvantitativnih podataka (npr. barometarski pritisak, temperatura zraka) umjesto kategorija kao što su spol ili omiljena boja.
Višestruki koeficijent korelacije
Pearson i Spearman su istraživali odnos između dvije varijable. Ali šta učiniti ako ih ima tri ili čak više. Ovdje dolazi do izražaja koeficijent višestruke korelacije. Na primjer, na bruto nacionalni proizvod utiču ne samo direktne strane investicije, već i monetarna i fiskalna politika države, kao i nivo izvoza. Stopa rasta i obim BDP-a rezultat su interakcije brojnih faktora. Međutim, treba shvatiti da je model višestruke korelacije zasnovan na brojnim pojednostavljenjima i pretpostavkama. Prvo, multikolinearnost između veličina je isključena. Drugo, pretpostavlja se da je odnos između zavisne varijable i varijabli koje utiču na nju linearan.
Oblasti upotrebe korelacione i regresione analize
Ova metoda pronalaženja odnosa između veličina se široko koristi u statistici. Najčešće se pribjegava u tri glavna slučaja:
- Za testiranje uzročno-posledičnih veza između vrijednosti dvije varijable. Kao rezultat toga, istraživač se nada da će pronaći linearnu vezu i izvesti formulu koja opisuje ove odnose između veličina. Njihove mjerne jedinice mogu biti različite.
- Za provjeru odnosa između vrijednosti. U ovom slučaju, niko ne određuje koja je varijabla zavisna. Može se ispostaviti da vrijednost obje veličine određuje neki drugi faktor.
- Da izvedemo jednačinu. U ovom slučaju, možete jednostavno zamijeniti brojeve u njega i saznati vrijednosti nepoznate varijable.
Muškarac u potrazi za uzročno-posledičnom vezom
Svijest je tako uređena da svakako moramo objasniti događaje koji se dešavaju okolo. Čovjek uvijek traži vezu između slike svijeta u kojem živi i informacija koje prima. Često mozak stvara red iz haosa. On lako može uočiti uzročno-posledične veze tamo gdje ih nema. Naučnici moraju posebno naučiti da prevladaju ovaj trend. Sposobnost evaluacije odnosa između podataka objektivno je neophodna u akademskoj karijeri.
Medijska pristrasnost
Razmotrite kako prisustvo korelacije može biti pogrešno protumačeno. Grupa britanskih studenata lošeg ponašanja upitana je da li njihovi roditelji puše. Zatim je test objavljen u novinama. Rezultat je pokazao snažnu korelaciju između pušenja roditelja i delinkvencije njihove djece. Profesor koji je vodio ovu studiju čak je predložio da se o tome stavi upozorenje na kutijama cigareta. Međutim, postoji niz problema s ovim zaključkom. Prvo, korelacija ne pokazuje koja je od veličina nezavisna. Stoga je sasvim moguće pretpostaviti da je pogubna navika roditelja uzrokovana neposlušnošću djece. Drugo, nemoguće je sa sigurnošću reći da oba problema nisu nastala zbog nekog trećeg faktora. Na primjer, porodice sa niskim primanjima. Treba napomenuti i emocionalni aspekt početnih zaključaka profesora koji je vodio istraživanje. Bio je vatreni protivnik pušenja. Stoga nije iznenađujuće što je na ovaj način tumačio rezultate svog istraživanja.
zaključci
Pogrešno tumačenje korelacije kao uzročne veze između dvije varijable može dovesti do neugodnih grešaka u istraživanju. Problem je što leži u samoj srži ljudske svijesti. Mnogi marketinški trikovi temelje se na ovoj osobini. Razumijevanje razlike između uzročnosti i korelacije omogućava vam da racionalno analizirate informacije kako u svakodnevnom životu tako iu vašoj profesionalnoj karijeri.