რა არის კორელაცია სტატისტიკაში. კორელაციის კოეფიციენტი არის კორელაციის მოდელის მახასიათებელი. როგორ განვსაზღვროთ პირსონის კორელაციის კოეფიციენტის მნიშვნელობა
![რა არის კორელაცია სტატისტიკაში. კორელაციის კოეფიციენტი არის კორელაციის მოდელის მახასიათებელი. როგორ განვსაზღვროთ პირსონის კორელაციის კოეფიციენტის მნიშვნელობა](https://i2.wp.com/psyfactor.org/lib/i/Image45.gif)
» სტატისტიკა
სტატისტიკა და მონაცემთა დამუშავება ფსიქოლოგიაში
(გაგრძელება)
კორელაციური ანალიზი
სწავლისას კორელაციებიშეეცადეთ დაადგინოთ არის თუ არა კავშირი ორ ინდიკატორს შორის ერთსა და იმავე ნიმუშში (მაგალითად, ბავშვების სიმაღლესა და წონას შორის ან დონეს შორის IQდა სკოლის წარმადობა) ან ორ განსხვავებულ ნიმუშს შორის (მაგალითად, ტყუპების წყვილის შედარებისას) და თუ ეს ურთიერთობა არსებობს, ერთი ინდიკატორის ზრდას ახლავს მატება (დადებითი კორელაცია) თუ შემცირება (უარყოფითი კორელაცია). სხვა.
სხვა სიტყვებით რომ ვთქვათ, კორელაციის ანალიზი გვეხმარება იმის დადგენაში, შესაძლებელია თუ არა ერთი ინდიკატორის შესაძლო მნიშვნელობების პროგნოზირება, მეორის მნიშვნელობის ცოდნა.
ამ დრომდე, მარიხუანას ეფექტის შესწავლის ჩვენი გამოცდილების შედეგების გაანალიზებისას, ჩვენ განზრახ უგულებელყოფდით ისეთ ინდიკატორს, როგორიცაა რეაქციის დრო. იმავდროულად, საინტერესო იქნებოდა იმის შემოწმება, არის თუ არა კავშირი რეაქციების ეფექტურობასა და მათ სიჩქარეს შორის. ეს საშუალებას მისცემს, მაგალითად, იმის მტკიცება, რომ რაც უფრო ნელია ადამიანი, მით უფრო ზუსტი და ეფექტური იქნება მისი ქმედებები და პირიქით.
ამ მიზნით შეიძლება გამოყენებულ იქნას ორი განსხვავებული მეთოდი: ბრავეს-პირსონის კოეფიციენტის (r) გამოთვლის პარამეტრული მეთოდი და სპირმენის რანგის კორელაციის კოეფიციენტის (r s) გამოთვლა, რომელიც გამოიყენება რიგით მონაცემებზე, ე.ი. არის არაპარამეტრული. თუმცა, ჯერ გავიგოთ, რა არის კორელაციის კოეფიციენტი.
Კორელაციის კოეფიციენტი
კორელაციის კოეფიციენტი არის მნიშვნელობა, რომელიც შეიძლება განსხვავდებოდეს +1-დან -1-მდე. სრული დადებითი კორელაციის შემთხვევაში ეს კოეფიციენტი უდრის პლუს 1-ს, ხოლო სრული უარყოფითი კორელაციის შემთხვევაში არის მინუს 1. გრაფიკზე ეს შეესაბამება სწორ ხაზს, რომელიც გადის გადაკვეთის წერტილებში. თითოეული მონაცემთა წყვილის მნიშვნელობები:
თუ ეს წერტილები სწორ ხაზში არ არის გაფორმებული, მაგრამ ქმნიან „ღრუბელს“, კორელაციის კოეფიციენტის აბსოლუტური მნიშვნელობა ხდება ერთზე ნაკლები და ღრუბლის დამრგვალებისას ნულს უახლოვდება:
თუ კორელაციის კოეფიციენტი არის 0, მაშინ ორივე ცვლადი სრულიად დამოუკიდებელია ერთმანეთისგან.
ჰუმანიტარულ მეცნიერებებში კორელაცია ძლიერად ითვლება, თუ მისი კოეფიციენტი 0,60-ზე მეტია; თუ ის აღემატება 0,90-ს, მაშინ კორელაცია ითვლება ძალიან ძლიერად. თუმცა, იმისთვის, რომ შევძლოთ ცვლადებს შორის დამოკიდებულების შესახებ დასკვნების გამოტანა, ნიმუშის ზომას დიდი მნიშვნელობა აქვს: რაც უფრო დიდია ნიმუში, მით უფრო სანდოა მიღებული კორელაციის კოეფიციენტის მნიშვნელობა. არსებობს ცხრილები ბრავეს-პირსონის და სპირმანის კორელაციის კოეფიციენტების კრიტიკული მნიშვნელობებით თავისუფლების სხვადასხვა ხარისხისთვის (ეს უდრის წყვილთა რაოდენობას მინუს 2, ე.ი. n- 2). მხოლოდ იმ შემთხვევაში, თუ კორელაციის კოეფიციენტები აღემატება ამ კრიტიკულ მნიშვნელობებს, ისინი შეიძლება ჩაითვალოს საიმედოდ. ასე რომ, იმისთვის, რომ კორელაციის კოეფიციენტი 0.70 იყოს სანდო, ანალიზში უნდა იქნას მიღებული მინიმუმ 8 წყვილი მონაცემი. (თ =n-2=6) r (იხ. ცხრილი 4 დანართში) და 7 წყვილი მონაცემის (h =) გაანგარიშებისას n-2= 5) r s-ის გაანგარიშებისას (ცხრილი 5 დანართში).
კიდევ ერთხელ მინდა ხაზგასმით აღვნიშნო, რომ ამ ორი კოეფიციენტის არსი გარკვეულწილად განსხვავებულია. უარყოფითი კოეფიციენტი r მიუთითებს იმაზე, რომ ეფექტურობა ყველაზე ხშირად რაც უფრო მაღალია, მით უფრო სწრაფია რეაქციის დრო, ხოლო r s კოეფიციენტის გამოთვლისას საჭირო იყო იმის შემოწმება, უფრო სწრაფი სუბიექტები ყოველთვის უფრო ზუსტად რეაგირებენ, ხოლო ნელი სუბიექტები ნაკლებად ზუსტად.
ბრავეს-პირსონის კორელაციის კოეფიციენტი (r) - ეს არის პარამეტრული მაჩვენებელი, რომლის გამოსათვლელად შედარებულია ორი გაზომვის შედეგების საშუალო და სტანდარტული გადახრები. ამ შემთხვევაში გამოიყენება ფორმულა (სხვადასხვა ავტორებისთვის ის შეიძლება განსხვავებულად გამოიყურებოდეს)
სადაც Σ XY-თითოეული წყვილის მონაცემების ნამრავლების ჯამი;
n არის წყვილების რაოდენობა;
X - საშუალო მოცემული ცვლადი x;
ი -
საშუალო ცვლადი მონაცემებისთვის ი
Sx-სტანდარტული გადახრა განაწილებისთვის X;
Sy-სტანდარტული გადახრა განაწილებისთვის ზე
სპირმენის რანგის კორელაციის კოეფიციენტი (რს ) - ეს არის არაპარამეტრული ინდიკატორი, რომლის დახმარებით ისინი ცდილობენ გამოავლინონ კავშირი შესაბამისი რაოდენობების რიგებს შორის გაზომვების ორ სერიაში.
ამ კოეფიციენტის გამოთვლა უფრო ადვილია, მაგრამ შედეგები ნაკლებად ზუსტია, ვიდრე r-ის გამოყენება. ეს გამოწვეულია იმით, რომ Spearman-ის კოეფიციენტის გაანგარიშებისას გამოიყენება მონაცემების თანმიმდევრობა და არა მათი რაოდენობრივი მახასიათებლები და კლასებს შორის ინტერვალები.
ფაქტია, რომ Spearman-ის რანგის (r s) კორელაციის კოეფიციენტის გამოყენებისას ისინი მხოლოდ ამოწმებენ, იქნება თუ არა ნებისმიერი ნიმუშის მონაცემების რეიტინგი იგივე, რაც ამ ნიმუშის სხვა მონაცემების სერიებში, პირველთან დაკავშირებულ წყვილში (მაგ. , იქნებიან თუ არა ისინი ერთნაირი „რეიტინგული“ სტუდენტების მიერ როგორც ფსიქოლოგიაში, ასევე მათემატიკაში, ან თუნდაც ორი განსხვავებული ფსიქოლოგიის მასწავლებელი?). თუ კოეფიციენტი ახლოს არის +1-თან, მაშინ ეს ნიშნავს, რომ ორივე სერია პრაქტიკულად ემთხვევა და თუ ეს კოეფიციენტი -1-სთან ახლოსაა, შეგვიძლია ვისაუბროთ სრულ შებრუნებულ ურთიერთობაზე.
კოეფიციენტი რსგამოითვლება ფორმულის მიხედვით
სადაც დარის განსხვავება კონიუგირებული მახასიათებლის მნიშვნელობების რიგებს შორის (მიუხედავად მისი ნიშნისა) და არის წყვილების რაოდენობა.
როგორც წესი, ეს არაპარამეტრული ტესტი გამოიყენება იმ შემთხვევებში, როდესაც საჭიროა გარკვეული დასკვნების გაკეთება არა იმდენად ინტერვალებითმონაცემებს შორის, რამდენია მათ შესახებ წოდებები,და ასევე, როდესაც განაწილების მრუდები ძალიან დახრილია და არ იძლევა პარამეტრული კრიტერიუმების გამოყენებას, როგორიცაა კოეფიციენტი r (ამ შემთხვევებში შეიძლება საჭირო გახდეს რაოდენობრივი მონაცემების გადაქცევა რიგით მონაცემებად).
Შემაჯამებელი
ასე რომ, ჩვენ განვიხილეთ სხვადასხვა პარამეტრული და არაპარამეტრული სტატისტიკური მეთოდები, რომლებიც გამოიყენება ფსიქოლოგიაში. ჩვენი მიმოხილვა იყო ძალიან ზედაპირული და მისი მთავარი ამოცანა იყო მკითხველს გაეგო, რომ სტატისტიკა არ არის ისეთი საშინელი, როგორც ჩანს და ძირითადად საღ აზრს მოითხოვს. შეგახსენებთ, რომ „გამოცდილების“ მონაცემები, რომლებსაც აქ შევეხეთ, არის ფიქტიური და ვერ გამოდგება რაიმე დასკვნის საფუძველს. თუმცა, ასეთი ექსპერიმენტის გაკეთება ღირდა. ვინაიდან ამ ექსპერიმენტისთვის არჩეული იქნა წმინდა კლასიკური ტექნიკა, იგივე სტატისტიკური ანალიზი შეიძლება გამოყენებულ იქნას მრავალ სხვადასხვა ექსპერიმენტში. ნებისმიერ შემთხვევაში, გვეჩვენება, რომ ჩვენ გამოვყავით რამდენიმე ძირითადი მიმართულება, რომელიც შეიძლება გამოადგეს მათ, ვინც არ იცის, საიდან დაიწყოს შედეგების სტატისტიკური ანალიზი.
ლიტერატურა
- გოდფროი ჯ.რა არის ფსიქოლოგია. - მ., 1992 წ.
- შატილონ გ., 1977. Statistique en Sciences humaines, Trois-Rivieres, Ed. SMG.
- გილბერტ ნ. 1978. სტატისტიკა, მონრეალი, რედ. H.R.W.
- მორონი მ.ჯ., 1970 წ. Comprendre la statistique, Verviers, Gerard et Cie.
- სიგელ ს., 1956. არაპარამეტრული სტატისტიკა, ნიუ-იორკი, MacGraw-Hill Book Co.
ცხრილების აპლიკაცია
შენიშვნები. 1) დიდი ნიმუშებისთვის ან 0,05-ზე ნაკლები მნიშვნელოვნების დონეებისთვის, იხილეთ სტატისტიკური სახელმძღვანელოების ცხრილები.
2) სხვა არაპარამეტრული კრიტერიუმების მნიშვნელობების ცხრილები შეგიძლიათ იხილოთ სპეციალურ სახელმძღვანელოში (იხ. ბიბლიოგრაფია).
ცხრილი 1. კრიტერიუმის მნიშვნელობები ტᲡტუდენტი | |
თ | 0,05 |
1 | 6,31 |
2 | 2,92 |
3 | 2,35 |
4 | 2,13 |
5 | 2,02 |
6 | 1,94 |
7 | 1,90 |
8 | 1,86 |
9 | 1,83 |
10 | 1,81 |
11 | 1,80 |
12 | 1,78 |
13 | 1,77 |
14 | 1,76 |
15 | 1,75 |
16 | 1,75 |
17 | 1,74 |
18 | 1,73 |
19 | 1,73 |
20 | 1,73 |
21 | 1,72 |
22 | 1,72 |
23 | 1,71 |
24 | 1,71 |
25 | 1,71 |
26 | 1,71 |
27 | 1,70 |
28 | 1,70 |
29 | 1,70 |
30 | 1,70 |
40 | 1,68 |
¥ | 1,65 |
ცხრილი 2. χ 2 კრიტერიუმის მნიშვნელობები | |
თ | 0,05 |
1 | 3,84 |
2 | 5,99 |
3 | 7,81 |
4 | 9,49 |
5 | 11,1 |
6 | 12,6 |
7 | 14,1 |
8 | 15,5 |
9 | 16,9 |
10 | 18,3 |
ცხრილი 3. სანდო Z მნიშვნელობები | |
რ | ზ |
0,05 | 1,64 |
0,01 | 2,33 |
ცხრილი 4. რ-ის სანდო (კრიტიკული) მნიშვნელობები | ||
სთ =(N-2) | p= 0,05 (5%) | |
3 | 0,88 | |
4 | 0,81 | |
5 | 0,75 | |
6 | 0,71 | |
7 | 0,67 | |
8 | 0,63 | |
9 | 0,60 | |
10 | 0,58 | |
11 | 0.55 | |
12 | 0,53 | |
13 | 0,51 | |
14 | 0,50 | |
15 | 0,48 | |
16 | 0,47 | |
17 | 0,46 | |
18 | 0,44 | |
19 | 0,43 | |
20 | 0,42 |
ცხრილი 5. r s-ის სანდო (კრიტიკული) მნიშვნელობები | |
სთ =(N-2) | p = 0,05 |
2 | 1,000 |
3 | 0,900 |
4 | 0,829 |
5 | 0,714 |
6 | 0,643 |
7 | 0,600 |
8 | 0,564 |
10 | 0,506 |
12 | 0,456 |
14 | 0,425 |
16 | 0,399 |
18 | 0,377 |
20 | 0,359 |
22 | 0,343 |
24 | 0,329 |
26 | 0,317 |
28 | 0,306 |
Კორელაციის კოეფიციენტიარის მნიშვნელობა, რომელიც შეიძლება განსხვავდებოდეს +1-დან -1-მდე. სრული დადებითი კორელაციის შემთხვევაში ეს კოეფიციენტი უდრის პლუს 1-ს (ამბობენ, რომ ერთი ცვლადის მნიშვნელობის მატებასთან ერთად მეორე ცვლადის მნიშვნელობა იზრდება), ხოლო სრული უარყოფითი კორელაციით - მინუს 1 (მიუთითეთ უკუკავშირი ანუ როდესაც ერთი ცვლადის მნიშვნელობები იზრდება, მეორის მნიშვნელობები მცირდება).
მაგალითი 1:
სიმორცხვისა და დეპრესიის დამოკიდებულების გრაფიკი. როგორც ხედავთ, წერტილები (სუბიექტები) შემთხვევით არ არის განლაგებული, არამედ დგანან ერთი ხაზის გარშემო და ამ ხაზის დათვალიერებისას შეგვიძლია ვთქვათ, რომ რაც უფრო მაღალია ადამიანში მორცხვობა, მით უფრო დეპრესიულია, ანუ ეს ფენომენები. ურთიერთდაკავშირებულები არიან.
მაგ. 2: დიაგრამა სიმორცხვისა და კომუნიკაბელურობისთვის. ჩვენ ვხედავთ, რომ სიმორცხვის მატებასთან ერთად მცირდება კომუნიკაბელურობა. მათი კორელაციის კოეფიციენტია -0,43. ამრიგად, 0-დან 1-მდე მეტი კორელაციის კოეფიციენტი მიუთითებს პირდაპირპროპორციულ ურთიერთობაზე (რაც მეტი ... მით მეტი ...), ხოლო კოეფიციენტი -1-დან 0-მდე მიუთითებს უკუპროპორციულ ურთიერთობაზე (რაც მეტი ... მით ნაკლები . ..)
თუ კორელაციის კოეფიციენტი არის 0, მაშინ ორივე ცვლადი სრულიად დამოუკიდებელია ერთმანეთისგან.
კორელაცია- ეს არის ურთიერთობა, სადაც ცალკეული ფაქტორების გავლენა ჩნდება მხოლოდ ტენდენციად (საშუალოდ) რეალურ მონაცემებზე მასობრივი დაკვირვებით. კორელაციური დამოკიდებულების მაგალითები შეიძლება იყოს დამოკიდებულება ბანკის აქტივების ზომასა და ბანკის მოგების ოდენობას შორის, შრომის პროდუქტიულობის ზრდას და თანამშრომლების სტაჟს შორის.
გამოყენებულია კორელაციების კლასიფიკაციის ორი სისტემა მათი სიძლიერის მიხედვით: ზოგადი და კონკრეტული.
კორელაციების ზოგადი კლასიფიკაცია: 1) ძლიერი, ან დახურული კორელაციის კოეფიციენტით r> 0.70; 2) საშუალო 0.500.70, და არა მხოლოდ მაღალი დონის მნიშვნელობის კორელაცია.ქვემოთ მოცემულ ცხრილში მოცემულია კორელაციის კოეფიციენტების სახელები სხვადასხვა ტიპის მასშტაბებისთვის.
დიქოტომიური მასშტაბი (1/0) | რანგის (რიგით) სკალა | ||
დიქოტომიური მასშტაბი (1/0) | პირსონის ასოციაციის კოეფიციენტი, პირსონის ოთხუჯრედიანი კონიუგაციის კოეფიციენტი. | ბისერიული კორელაცია | |
რანგის (რიგით) სკალა | რანგ-ბისერიული კორელაცია. | სპირმენის ან კენდალის წოდების კორელაციის კოეფიციენტი. | |
ინტერვალი და აბსოლუტური მასშტაბი | ბისერიული კორელაცია | ინტერვალის სკალის მნიშვნელობები გარდაიქმნება რანგებად და გამოიყენება რანგის კოეფიციენტი | პირსონის კორელაციის კოეფიციენტი (წრფივი კორელაციის კოეფიციენტი) |
ზე რ=0 არ არსებობს წრფივი კორელაცია. ამ შემთხვევაში, ცვლადების ჯგუფის საშუალოები ემთხვევა მათ ზოგად საშუალებებს, ხოლო რეგრესიის ხაზები კოორდინატთა ღერძების პარალელურია.
Თანასწორობა რ=0 საუბრობს მხოლოდ წრფივი კორელაციური დამოკიდებულების არარსებობაზე (არაკორელაციური ცვლადები), მაგრამ არა ზოგადად კორელაციის არარსებობაზე და მით უმეტეს, სტატისტიკურ დამოკიდებულებაზე.
ზოგჯერ დასკვნა, რომ არ არსებობს კორელაცია უფრო მნიშვნელოვანია, ვიდრე ძლიერი კორელაციის არსებობა. ორი ცვლადის ნულოვანი კორელაცია შეიძლება მიუთითებდეს, რომ არ არსებობს ერთი ცვლადის გავლენა მეორეზე, იმ პირობით, რომ ჩვენ ვენდობით გაზომვების შედეგებს.
SPSS-ში: 11.3.2 კორელაციის კოეფიციენტები
აქამდე ჩვენ გავარკვიეთ მხოლოდ ორ მახასიათებელს შორის სტატისტიკური კავშირის არსებობის ფაქტი. შემდეგი, ჩვენ შევეცდებით გავარკვიოთ, რა დასკვნების გაკეთება შეიძლება ამ დამოკიდებულების სიძლიერესა თუ სისუსტეზე, ასევე მის ფორმასა და მიმართულებაზე. ცვლადებს შორის ურთიერთობის რაოდენობრივი განსაზღვრის კრიტერიუმებს უწოდებენ კორელაციის კოეფიციენტებს ან დაკავშირების საზომებს. ორი ცვლადი დადებითად არის დაკავშირებული, თუ მათ შორის არის პირდაპირი, ცალმხრივი კავშირი. ცალმხრივი ურთიერთობისას, ერთი ცვლადის მცირე მნიშვნელობები შეესაბამება მეორე ცვლადის მცირე მნიშვნელობებს, დიდი მნიშვნელობები შეესაბამება დიდს. ორი ცვლადი უარყოფითად არის დაკავშირებული, თუ მათ შორის საპირისპირო კავშირია. მრავალმხრივი ურთიერთობით, ერთი ცვლადის მცირე მნიშვნელობები შეესაბამება მეორე ცვლადის დიდ მნიშვნელობებს და პირიქით. კორელაციის კოეფიციენტების მნიშვნელობები ყოველთვის არის -1-დან +1-მდე დიაპაზონში.
Spearman-ის კოეფიციენტი გამოიყენება როგორც კორელაციის კოეფიციენტი რიგითი სკალის კუთვნილ ცვლადებს შორის, ხოლო პირსონის კორელაციის კოეფიციენტი (პროდუქტების მომენტი) გამოიყენება ინტერვალის სკალის კუთვნილ ცვლადებზე. ამ შემთხვევაში უნდა აღინიშნოს, რომ ყოველი დიქოტომიური ცვლადი, ანუ ცვლადი, რომელიც ეკუთვნის ნომინალურ შკალას და აქვს ორი კატეგორია, შეიძლება ჩაითვალოს რიგობით.
პირველ რიგში, ჩვენ შევამოწმებთ, არის თუ არა კორელაცია სქესისა და ფსიქიკის ცვლადებს შორის studium.sav ფაილიდან. ამით გავითვალისწინებთ, რომ დიქოტომიური ცვლადი სქესი შეიძლება ჩაითვალოს რიგით ცვლადად. გააკეთეთ შემდეგი:
აირჩიეთ ბრძანების მენიუდან Analyze (Analysis) Descriptive Statistics (Descriptive statistics) Crosstabs... (შემთხვევითი ცხრილები)
· ცვლადი სქესის გადატანა მწკრივების სიაში და ცვლადი ფსიქიკა სვეტების სიაში.
· დააწკაპუნეთ ღილაკზე სტატისტიკა.... Crosstabs: Statistics დიალოგში მონიშნეთ კორელაციების ველი. დაადასტურეთ თქვენი არჩევანი Continue ღილაკით.
· Crosstabs დიალოგში შეწყვიტე ცხრილების ჩვენება Supress tables-ის ჩამრთველით. დააჭირეთ ღილაკს OK.
გამოითვლება სპირმენის და პირსონის კორელაციის კოეფიციენტები და შემოწმდება მათი მნიშვნელობა:
/ SPSS 10
დავალება ნომერი 10 კორელაციური ანალიზი
კორელაციის ცნება
კორელაცია ანუ კორელაციის კოეფიციენტი სტატისტიკური მაჩვენებელია სავარაუდორაოდენობრივი შკალებით გაზომილი ორ ცვლადს შორის ურთიერთობა. ფუნქციური კავშირისგან განსხვავებით, რომელშიც ერთი ცვლადის თითოეული მნიშვნელობა შეესაბამება მკაცრად განსაზღვრულისხვა ცვლადის მნიშვნელობა, სავარაუდო კავშირიხასიათდება იმით, რომ ერთი ცვლადის თითოეული მნიშვნელობა შეესაბამება ღირებულებების ნაკრებიკიდევ ერთი ცვლადი, ალბათური ურთიერთობის მაგალითია კავშირი ადამიანების სიმაღლესა და წონას შორის. გასაგებია, რომ სხვადასხვა წონის ადამიანებს შეიძლება ჰქონდეთ ერთი და იგივე სიმაღლე და პირიქით.
კორელაცია არის მნიშვნელობა -1-სა და +1-ს შორის და აღინიშნება ასო r-ით. უფრო მეტიც, თუ მნიშვნელობა უფრო ახლოს არის 1-თან, მაშინ ეს ნიშნავს ძლიერი კავშირის არსებობას, ხოლო თუ ის უფრო ახლოს არის 0-თან, მაშინ სუსტი. 0.2-ზე ნაკლები კორელაციის მნიშვნელობა ითვლება სუსტ კორელაციად, 0.5-ზე მეტი - მაღალი. თუ კორელაციის კოეფიციენტი უარყოფითია, ეს ნიშნავს, რომ არსებობს უკუკავშირი: რაც უფრო მაღალია ერთი ცვლადის მნიშვნელობა, მით უფრო დაბალია მეორის მნიშვნელობა.
r კოეფიციენტის მიღებული მნიშვნელობებიდან გამომდინარე, შეიძლება გამოიყოს კორელაციის სხვადასხვა ტიპები:
ძლიერი დადებითი კორელაციაგანისაზღვრება r=1 მნიშვნელობით. ტერმინი "მკაცრი" ნიშნავს, რომ ერთი ცვლადის მნიშვნელობა ცალსახად განისაზღვრება სხვა ცვლადის მნიშვნელობებით და ტერმინი " დადებითი" -რომ როგორც ერთი ცვლადის მნიშვნელობა იზრდება, ასევე იზრდება მეორე ცვლადის მნიშვნელობაც.
მკაცრი კორელაცია არის მათემატიკური აბსტრაქცია და რეალურ კვლევაში თითქმის არასოდეს გვხვდება.
დადებითი კორელაციაშეესაბამება მნიშვნელობებს 0
კორელაციის ნაკლებობაგანისაზღვრება r=0 მნიშვნელობით. ნულის კორელაციის კოეფიციენტი მიუთითებს იმაზე, რომ ცვლადების მნიშვნელობები არანაირად არ არის დაკავშირებული ერთმანეთთან.
კორელაციის ნაკლებობა ჰ ო : 0 რ xy =0 ჩამოყალიბებული, როგორც ანარეკლი nullჰიპოთეზები კორელაციის ანალიზში.
უარყოფითი კორელაცია: -1
ძლიერი უარყოფითი კორელაციაგანისაზღვრება r= -1 მნიშვნელობით. ის, ისევე როგორც მკაცრი დადებითი კორელაცია, არის აბსტრაქცია და ვერ პოულობს გამოხატულებას პრაქტიკულ კვლევაში.
ცხრილი 1
კორელაციის სახეები და მათი განმარტებები
კორელაციის კოეფიციენტის გამოთვლის მეთოდი დამოკიდებულია მასშტაბის ტიპზე, რომელზედაც იზომება ცვლადის მნიშვნელობები.
Კორელაციის კოეფიციენტი რპირსონიარის მთავარი და შეიძლება გამოყენებულ იქნას ცვლადებისთვის ნომინალური და ნაწილობრივ მოწესრიგებული ინტერვალის შკალებით, რომლებზედაც მნიშვნელობების განაწილება შეესაბამება ნორმას (პროდუქტის მომენტების კორელაცია). პირსონის კორელაციის კოეფიციენტი საკმაოდ ზუსტ შედეგებს იძლევა არანორმალური განაწილების შემთხვევაშიც.
განაწილებისთვის, რომლებიც არ არის ნორმალური, სასურველია გამოიყენოთ Spearman და Kendall რანგის კორელაციის კოეფიციენტები. ისინი რანჟირებულია, რადგან პროგრამა წინასწარ აფასებს კორელაციურ ცვლადებს.
SPSS პროგრამა ითვლის r-Spearman-ის კორელაციას შემდეგნაირად: ჯერ ცვლადები გარდაიქმნება რანგებად, შემდეგ კი Pearson-ფორმულა გამოიყენება რიგებში.
M. Kendall-ის მიერ შემოთავაზებული კორელაცია ეფუძნება იმ აზრს, რომ კავშირის მიმართულების შეფასება შესაძლებელია საგნების წყვილებში შედარების გზით. თუ წყვილი სუბიექტისთვის X-ის ცვლილება ემთხვევა მიმართულებით Y-ის ცვლილებას, მაშინ ეს მიუთითებს დადებით ურთიერთობაზე. თუ ეს არ ემთხვევა, მაშინ უარყოფით ურთიერთობაზე. ამ კოეფიციენტს ძირითადად მცირე ნიმუშებით მომუშავე ფსიქოლოგები იყენებენ. მას შემდეგ, რაც სოციოლოგები მუშაობენ მონაცემთა დიდ მასივებთან, ძნელია წყვილების დალაგება, ფარდობითი სიხშირეების სხვაობისა და ინვერსიების იდენტიფიცირება ყველა წყვილი სუბიექტის ნიმუშში. ყველაზე გავრცელებული არის კოეფიციენტი. პირსონი.
ვინაიდან კორელაციის კოეფიციენტი rPearson არის მთავარი და შეიძლება გამოყენებულ იქნას (გარკვეული შეცდომით, რაც დამოკიდებულია სკალის ტიპზე და არანორმალურ დონეზე განაწილებაში) რაოდენობრივ სკალებზე გაზომილი ყველა ცვლადისთვის, განვიხილავთ მისი გამოყენების მაგალითებს და შევადარებთ სხვა კორელაციის კოეფიციენტების გამოყენებით გაზომვების შედეგებით მიღებული შედეგები.
კოეფიციენტის გამოთვლის ფორმულა რ- პირსონი:
r xy = ∑ (Xi-Xav)∙(Yi-Yav) / (N-1)∙σ x ∙σ y ∙
სად: Xi, Yi- ორი ცვლადის მნიშვნელობები;
Xav, Yav - ორი ცვლადის საშუალო მნიშვნელობები;
σ x, σ y არის სტანდარტული გადახრები,
N არის დაკვირვებების რაოდენობა.
წყვილთა კორელაციები
მაგალითად, ჩვენ გვსურს გავარკვიოთ, თუ როგორ არის დაკავშირებული პასუხები სხვადასხვა ტიპის ტრადიციულ ღირებულებებს შორის სტუდენტების იდეებში სამუშაოს იდეალური ადგილის შესახებ (ცვლადები: a9.1, a9.3, a9.5, a9.7). , შემდეგ კი ლიბერალური მნიშვნელობების თანაფარდობის შესახებ (a9 .2, a9.4, a9.6, a9.8). ეს ცვლადები ფასდება 5-ვადიანი მოწესრიგებული სკალებით.
ვიყენებთ პროცედურას: "ანალიზი", "კორელაციები", "დაწყვილებული". სტანდარტულად, კოეფიციენტი Pearson დაყენებულია დიალოგურ ფანჯარაში. ჩვენ ვიყენებთ კოეფიციენტს პირსონი
შემოწმებული ცვლადები გადადის შერჩევის ფანჯარაში: a9.1, a9.3, a9.5, a9.7
OK-ზე დაჭერით ვიღებთ გამოთვლას:
კორელაციები
a9.1.t. რამდენად მნიშვნელოვანია ოჯახური და პირადი ცხოვრებისთვის საკმარისი დრო? |
პირსონის კორელაცია |
||||
მნიშვნელობა (ორმხრივი) |
|||||
a9.3.t. რამდენად მნიშვნელოვანია, რომ არ გეშინოდეს სამსახურის დაკარგვის? |
პირსონის კორელაცია |
||||
მნიშვნელობა (ორმხრივი) |
|||||
a9.5.t. რამდენად მნიშვნელოვანია ისეთი უფროსის ყოლა, რომელიც ამა თუ იმ გადაწყვეტილების მიღებისას გაგიწევს კონსულტაციას? |
პირსონის კორელაცია |
||||
მნიშვნელობა (ორმხრივი) |
|||||
a9.7.t. რამდენად მნიშვნელოვანია კარგად კოორდინირებულ გუნდში მუშაობა, იგრძნო თავი მის ნაწილად? |
პირსონის კორელაცია |
||||
მნიშვნელობა (ორმხრივი) |
|||||
** კორელაცია მნიშვნელოვანია 0.01 დონეზე (2 მხრივ).
აგებული კორელაციის მატრიცის რაოდენობრივი მნიშვნელობების ცხრილი
ნაწილობრივი კორელაციები:
პირველი, მოდით ავაშენოთ წყვილი კორელაცია ამ ორ ცვლადს შორის:
კორელაციები |
|||
c8. იგრძენით სიახლოვე მათთან, ვინც თქვენთან ახლოს ცხოვრობს, მეზობლებთან |
პირსონის კორელაცია |
||
მნიშვნელობა (ორმხრივი) |
|||
c12. იგრძენით თავი მათ ოჯახთან ახლოს |
პირსონის კორელაცია |
||
მნიშვნელობა (ორმხრივი) |
|||
**. კორელაცია მნიშვნელოვანია 0.01 დონეზე (2 მხრივ). |
შემდეგ ვიყენებთ ნაწილობრივი კორელაციის აგების პროცედურას: „ანალიზი“, „კორელაციები“, „ნაწილობრივი“.
დავუშვათ, რომ მნიშვნელობა "მნიშვნელოვანია დამოუკიდებლად განსაზღვროთ და შეცვალოთ თქვენი სამუშაოს თანმიმდევრობა" მითითებულ ცვლადებთან მიმართებაში იქნება გადამწყვეტი ფაქტორი, რომლის გავლენითაც ადრე გამოვლენილი ურთიერთობა გაქრება ან მცირე მნიშვნელობის აღმოჩნდება. .
კორელაციები |
||||
გამორიცხული ცვლადები |
c8. იგრძენით სიახლოვე მათთან, ვინც თქვენთან ახლოს ცხოვრობს, მეზობლებთან |
c12. იგრძენით თავი მათ ოჯახთან ახლოს |
||
c16. იგრძენით სიახლოვე იმ ადამიანებთან, რომლებსაც აქვთ იგივე სიმდიდრე, როგორც თქვენ |
c8. იგრძენით სიახლოვე მათთან, ვინც თქვენთან ახლოს ცხოვრობს, მეზობლებთან |
კორელაცია |
||
მნიშვნელობა (ორმხრივი) |
||||
c12. იგრძენით თავი მათ ოჯახთან ახლოს |
კორელაცია |
|||
მნიშვნელობა (ორმხრივი) |
||||
როგორც ცხრილიდან ჩანს, საკონტროლო ცვლადის გავლენით ურთიერთობა ოდნავ შემცირდა: 0.120-დან 0.102-მდე. ის რჩება საკმარისად მაღალი და საშუალებას აძლევს უარყოს ნულოვანი ჰიპოთეზა ნულოვანი შეცდომით.
Კორელაციის კოეფიციენტი
კორელაციის სიმკვრივისა და ბუნების დასადგენად ყველაზე ზუსტი გზაა კორელაციის კოეფიციენტის პოვნა. კორელაციის კოეფიციენტი არის რიცხვი, რომელიც განისაზღვრება ფორმულით:
სადაც r xy არის კორელაციის კოეფიციენტი;
x i - პირველი მახასიათებლის მნიშვნელობები;
i - მეორე მახასიათებლის მნიშვნელობები;
პირველი მახასიათებლის მნიშვნელობების საშუალო არითმეტიკული
მეორე მახასიათებლის მნიშვნელობების საშუალო არითმეტიკული
ფორმულის (32) გამოსაყენებლად ვაშენებთ ცხრილს, რომელიც უზრუნველყოფს რიცხვების მომზადების აუცილებელ თანმიმდევრობას კორელაციის კოეფიციენტის მრიცხველისა და მნიშვნელის საპოვნელად.
როგორც (32) ფორმულიდან ჩანს, მოქმედებების თანმიმდევრობა ასეთია: ვპოულობთ ორივე ნიშნის არითმეტიკულ საშუალებებს, ვპოულობთ განსხვავებას ნიშნის მნიშვნელობებსა და მის საშუალოს შორის (х i. - ) და y i - ), შემდეგ ვპოულობთ მათ ნამრავლს (х i - ) ( y i - ) – ამ უკანასკნელის ჯამი იძლევა კორელაციის კოეფიციენტის მრიცხველს. მისი მნიშვნელის საპოვნელად საჭიროა განსხვავებების კვადრატში (x i -) და (y i -), იპოვოთ მათი ჯამები და ამოიღოთ კვადრატული ფესვი მათი ნამრავლიდან.
მაგალითად 31, კორელაციის კოეფიციენტის პოვნა (32) ფორმულის შესაბამისად შეიძლება წარმოდგენილი იყოს შემდეგნაირად (ცხრილი 50).
კორელაციის კოეფიციენტის შედეგად მიღებული რიცხვი შესაძლებელს ხდის დადგინდეს ურთიერთობის არსებობა, სიახლოვე და ბუნება.
1. თუ კორელაციის კოეფიციენტი ნულია, მახასიათებლებს შორის კავშირი არ არის.
2. თუ კორელაციის კოეფიციენტი ერთის ტოლია, მახასიათებლებს შორის ურთიერთობა იმდენად დიდია, რომ ის ფუნქციონალურში გადადის.
3. კორელაციის კოეფიციენტის აბსოლუტური მნიშვნელობა არ სცილდება ნულიდან ერთამდე ინტერვალს:
ეს შესაძლებელს ხდის კავშირის სიმჭიდროვეზე ფოკუსირებას: რაც უფრო ახლოს არის კოეფიციენტი ნულთან, მით უფრო სუსტია კავშირი და რაც უფრო ახლოს არის ერთიანობასთან, მით უფრო მჭიდროა კავშირი.
4. კორელაციის კოეფიციენტის ნიშანი „პლუს“ ნიშნავს პირდაპირ კორელაციას, ნიშანი „მინუს“ საპირისპიროს.
მაგიდა 50
x i | მე | (х i - ) | (y მე - ) | (x i - )(y i - ) | (х i - )2 | (y i - )2 |
14,00 | 12,10 | -1,70 | -2,30 | +3,91 | 2,89 | 5,29 |
14,20 | 13,80 | -1,50 | -0,60 | +0,90 | 2,25 | 0,36 |
14,90 | 14,20 | -0,80 | -0,20 | +0,16 | 0,64 | 0,04 |
15,40 | 13,00 | -0,30 | -1,40 | +0,42 | 0,09 | 1,96 |
16,00 | 14,60 | +0,30 | +0,20 | +0,06 | 0,09 | 0,04 |
17,20 | 15,90 | +1,50 | +2,25 | 2,25 | ||
18,10 | 17,40 | +2,40 | +2,00 | +4,80 | 5,76 | 4,00 |
109,80 | 101,00 | 12,50 | 13,97 | 13,94 |
ამრიგად, 31-ე მაგალითში გამოთვლილი კორელაციის კოეფიციენტი არის r xy = +0.9. საშუალებას გვაძლევს გამოვიტანოთ შემდეგი დასკვნები: არსებობს კორელაცია შესწავლილ სკოლის მოსწავლეებში მარჯვენა და მარცხენა ხელის კუნთების სიძლიერის სიდიდეს შორის (კოეფიციენტი r xy \u003d + 0.9 არის არანულოვანი), ურთიერთობა ძალიან მჭიდროა (კოეფიციენტი r xy \u003d + 0.9 ერთიანობასთან ახლოს არის), კორელაცია პირდაპირია (კოეფიციენტი r xy = +0,9 დადებითია), ანუ ერთ-ერთი ხელის კუნთების სიძლიერის მატებასთან ერთად მეორე ხელის სიძლიერე იზრდება.
კორელაციის კოეფიციენტის გაანგარიშებისას და მისი თვისებების გამოყენებისას მხედველობაში უნდა იქნას მიღებული, რომ დასკვნები იძლევა სწორ შედეგებს, როდესაც მახასიათებლები ჩვეულებრივ ნაწილდება და როდესაც განიხილება კავშირი ორივე მახასიათებლის მნიშვნელობების დიდ რაოდენობას შორის.
განხილულ მაგალითში 31, გაანალიზდა ორივე მახასიათებლის მხოლოდ 7 მნიშვნელობა, რაც, რა თქმა უნდა, საკმარისი არ არის ასეთი კვლევებისთვის. აქ კიდევ ერთხელ შეგახსენებთ, რომ მაგალითები ამ წიგნში ზოგადად და ამ თავში კონკრეტულად არის საილუსტრაციო მეთოდების ხასიათი და არა რაიმე სამეცნიერო ექსპერიმენტის დეტალური პრეზენტაცია. შედეგად, განიხილება მცირე რაოდენობის მახასიათებლების მნიშვნელობები, გაზომვები მრგვალდება - ეს ყველაფერი კეთდება იმისათვის, რომ არ დაიფაროს მეთოდის იდეა რთული გამოთვლებით.
განსაკუთრებული ყურადღება უნდა მიექცეს განხილული ურთიერთობის არსს. კორელაციის კოეფიციენტი ვერ გამოიწვევს კვლევის სწორ შედეგებს, თუ მახასიათებლებს შორის ურთიერთობის ანალიზი ფორმალურად განხორციელდება. დავუბრუნდეთ მაგალითს 31. ორივე განხილული ნიშანი იყო მარჯვენა და მარცხენა ხელის კუნთების სიძლიერის მნიშვნელობები. წარმოვიდგინოთ, რომ x i მახასიათებლით მაგალითში 31 (14.0; 14.2; 14.9... ...18.1) ვგულისხმობთ შემთხვევით დაჭერილი თევზის სიგრძეს სანტიმეტრებში, ხოლო y i მახასიათებლით (12.1; 13.8; 14.2 ... ... 17.4) - ლაბორატორიაში ინსტრუმენტების წონა კილოგრამებში. ფორმალურად, გამოთვლების აპარატის გამოყენებით კორელაციის კოეფიციენტის საპოვნელად და ამ შემთხვევაშიც r xy =+0>9-ის მისაღებად, უნდა დავასკვნათ, რომ თევზის სიგრძესა და წონას შორის პირდაპირი ხასიათის მჭიდრო კავშირია. ინსტრუმენტები. ასეთი დასკვნის აბსურდულობა აშკარაა.
კორელაციის კოეფიციენტის გამოყენების ფორმალური მიდგომის თავიდან ასაცილებლად, უნდა გამოვიყენოთ ნებისმიერი სხვა მეთოდი - მათემატიკური, ლოგიკური, ექსპერიმენტული, თეორიული - ნიშნებს შორის კორელაციის შესაძლებლობის დასადგენად, ანუ ნიშნების ორგანული ერთიანობის გამოსავლენად. მხოლოდ ამის შემდეგ შეიძლება დაიწყოს კორელაციური ანალიზის გამოყენება და დადგინდეს ურთიერთობის მასშტაბები და ბუნება.
მათემატიკურ სტატისტიკაში ასევე არსებობს კონცეფცია მრავალჯერადი კორელაცია- ურთიერთობები სამ ან მეტ მახასიათებელს შორის. ამ შემთხვევებში გამოიყენება მრავალჯერადი კორელაციის კოეფიციენტი, რომელიც შედგება ზემოთ აღწერილი წყვილი კორელაციის კოეფიციენტებისგან.
მაგალითად, სამი ნიშნის კორელაციის კოეფიციენტი - x і , y і , z і - არის:
სადაც R xyz -მრავალჯერადი კორელაციის კოეფიციენტი, რომელიც გამოხატავს თუ რამდენად არის დამოკიდებული x i თვისება y i და z i მახასიათებლებზე;
r xy -კორელაციის კოეფიციენტი x i და y i მახასიათებლებს შორის;
r xz - კორელაციის კოეფიციენტი Xi და Zi მახასიათებლებს შორის;
r yz - კორელაციის კოეფიციენტი y i, z i მახასიათებლებს შორის
კორელაციის ანალიზი არის:
კორელაციური ანალიზიკორელაცია- ორი ან მეტი შემთხვევითი ცვლადის სტატისტიკური კავშირი (ან ცვლადები, რომლებიც ასეთად შეიძლება ჩაითვალოს გარკვეული მისაღები სიზუსტით). ამავდროულად, ამ სიდიდის ერთი ან რამდენიმე ცვლილება იწვევს მეორე ან სხვა რაოდენობებში სისტემატურ ცვლილებას. კორელაციის კოეფიციენტი ემსახურება ორი შემთხვევითი ცვლადის კორელაციის მათემატიკური საზომს.
კორელაცია შეიძლება იყოს დადებითი და უარყოფითი (ასევე შესაძლებელია, რომ არ არსებობდეს სტატისტიკური კავშირი - მაგალითად, დამოუკიდებელი შემთხვევითი ცვლადებისთვის). უარყოფითი კორელაცია - კორელაცია, რომლის დროსაც ერთი ცვლადის ზრდა დაკავშირებულია მეორე ცვლადის შემცირებასთან, კორელაციის კოეფიციენტი კი უარყოფითია. დადებითი კორელაცია - კორელაცია, რომლის დროსაც ერთი ცვლადის ზრდა დაკავშირებულია მეორე ცვლადის ზრდასთან, კორელაციის კოეფიციენტი კი დადებითია.
ავტოკორელაცია - სტატისტიკური კავშირი შემთხვევით ცვლადებს შორის ერთი და იგივე სერიიდან, მაგრამ აღებული ცვლებით, მაგალითად, შემთხვევითი პროცესისთვის - დროის ცვლასთან ერთად.
სტატისტიკური მონაცემების დამუშავების მეთოდს, რომელიც შედგება ცვლადებს შორის კოეფიციენტების (კორელაციების) შესწავლაში, ე.წ. კორელაციის ანალიზი.
Კორელაციის კოეფიციენტი
Კორელაციის კოეფიციენტიან წყვილის კორელაციის კოეფიციენტიალბათობის თეორიასა და სტატისტიკაში ეს არის ორი შემთხვევითი ცვლადის ცვლილების ბუნების მაჩვენებელი. კორელაციის კოეფიციენტი აღინიშნება ლათინური ასო R-ით და შეუძლია მიიღოს მნიშვნელობები -1-დან +1-მდე. თუ მოდულის მნიშვნელობა უფრო ახლოს არის 1-თან, მაშინ ეს ნიშნავს ძლიერი კავშირის არსებობას (კორელაციის კოეფიციენტით ტოლია ერთი, ისინი საუბრობენ ფუნქციურ კავშირზე), ხოლო თუ 0-სთან ახლოს არის, მაშინ სუსტი.
პირსონის კორელაციის კოეფიციენტი
მეტრულ რაოდენობებზე გამოიყენება პირსონის კორელაციის კოეფიციენტი, რომლის ზუსტი ფორმულა შემოიღო ფრენსის გალტონმა:
დაე X,ი- ორი შემთხვევითი ცვლადი, რომლებიც განსაზღვრულია იმავე ალბათობის სივრცეში. შემდეგ მათი კორელაციის კოეფიციენტი მოცემულია ფორმულით:
![](https://i0.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
![](https://i1.wp.com/i.zna4enie.ru/1/znachenie-kojefficienta-korreljacii_10.png)
სადაც cov არის კოვარიანსი და D არის ვარიაცია, ან ექვივალენტურად,
,სადაც სიმბოლო აღნიშნავს მათემატიკურ მოლოდინს.
ასეთი ურთიერთობის გრაფიკულად წარმოსადგენად, შეგიძლიათ გამოიყენოთ მართკუთხა კოორდინატთა სისტემა ღერძებით, რომლებიც შეესაბამება ორივე ცვლადს. მნიშვნელობების თითოეული წყვილი აღინიშნება კონკრეტული სიმბოლოთი. ასეთ ნაკვეთს „სკატერპლატი“ ეწოდება.
კორელაციის კოეფიციენტის გამოთვლის მეთოდი დამოკიდებულია მასშტაბის ტიპზე, რომელსაც ეხება ცვლადები. ასე რომ, ცვლადების გასაზომად ინტერვალური და რაოდენობრივი შკალებით, აუცილებელია პირსონის კორელაციის კოეფიციენტის გამოყენება (პროდუქტის მომენტების კორელაცია). თუ ორი ცვლადიდან ერთს მაინც აქვს რიგითი მასშტაბი, ან არ არის ნორმალურად განაწილებული, უნდა იქნას გამოყენებული Spearman-ის რანგის კორელაცია ან კენდალის τ (tau). იმ შემთხვევაში, როდესაც ორი ცვლადიდან ერთ-ერთი დიქოტომიურია, გამოიყენება წერტილის ორსერიანი კორელაცია, ხოლო თუ ორივე ცვლადი დიქოტომიურია, გამოიყენება ოთხველიანი კორელაცია. ორ არადიქოტომურ ცვლადს შორის კორელაციის კოეფიციენტის გამოთვლას აზრი აქვს მხოლოდ იმ შემთხვევაში, თუ მათ შორის ურთიერთობა წრფივია (ცალმხრივი).
კენდელის კორელაციის კოეფიციენტი
გამოიყენება ურთიერთდარღვევის გასაზომად.
სპირმანის კორელაციის კოეფიციენტი
კორელაციის კოეფიციენტის თვისებები
- კოში - ბუნიაკოვსკის უთანასწორობა:
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
![](https://i1.wp.com/i.zna4enie.ru/a/znachenie-kojefficienta-korreljacii_14.png)
კორელაციური ანალიზი
კორელაციური ანალიზი- სტატისტიკური მონაცემების დამუშავების მეთოდი, რომელიც მოიცავს კოეფიციენტების შესწავლას ( კორელაციები) ცვლადებს შორის. ამ შემთხვევაში, ერთ წყვილს ან რამდენიმე წყვილ მახასიათებელს შორის კორელაციის კოეფიციენტები შედარებულია მათ შორის სტატისტიკური ურთიერთობების დასამყარებლად.
სამიზნე კორელაციის ანალიზი- მიაწოდეთ გარკვეული ინფორმაცია ერთი ცვლადის შესახებ სხვა ცვლადის დახმარებით. იმ შემთხვევებში, როდესაც შესაძლებელია მიზნის მიღწევა, ჩვენ ვამბობთ, რომ ცვლადები კორელაციური. მისი ყველაზე ზოგადი ფორმით, კორელაციის არსებობის ჰიპოთეზის მიღება ნიშნავს, რომ A ცვლადის მნიშვნელობის ცვლილება მოხდება B მნიშვნელობის პროპორციულ ცვლილებასთან ერთად: თუ ორივე ცვლადი გაიზრდება, მაშინ კორელაცია დადებითიათუ ერთი ცვლადი იზრდება და მეორე მცირდება, კორელაცია უარყოფითია.
კორელაცია ასახავს მხოლოდ რაოდენობების წრფივ დამოკიდებულებას, მაგრამ არ ასახავს მათ ფუნქციურ კავშირს. მაგალითად, თუ გამოვთვლით მნიშვნელობებს შორის კორელაციის კოეფიციენტს ა = სმენ(x) და ბ = გოს(x), მაშინ ის ახლოს იქნება ნულთან, ანუ არ არის დამოკიდებულება რაოდენობებს შორის. იმავდროულად, A და B რაოდენობა აშკარად დაკავშირებულია ფუნქციურად კანონის მიხედვით სმენ 2(x) + გოს 2(x) = 1.
კორელაციის ანალიზის შეზღუდვები
![](https://i1.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
![](https://i0.wp.com/i.zna4enie.ru/d/znachenie-kojefficienta-korreljacii_22.png)
- გამოყენება შესაძლებელია იმ შემთხვევაში, თუ არსებობს შესასწავლი შემთხვევების საკმარისი რაოდენობა: კორელაციის კოეფიციენტის კონკრეტული ტიპისთვის, ის მერყეობს 25-დან 100 წყვილამდე დაკვირვებით.
- მეორე შეზღუდვა გამომდინარეობს კორელაციური ანალიზის ჰიპოთეზიდან, რომელიც მოიცავს ცვლადების წრფივი დამოკიდებულება. ხშირ შემთხვევაში, როდესაც საიმედოდ არის ცნობილი, რომ დამოკიდებულება არსებობს, კორელაციურმა ანალიზმა შეიძლება არ მოგვცეს შედეგი მხოლოდ იმიტომ, რომ დამოკიდებულება არაწრფივია (გამოხატული, მაგალითად, პარაბოლის სახით).
- თავისთავად, კორელაციის ფაქტი არ იძლევა იმის მტკიცების საფუძველს, თუ რომელი ცვლადი წინ უსწრებს ან იწვევს ცვლილებებს, ან რომ ცვლადები ზოგადად მიზეზობრივად არის დაკავშირებული ერთმანეთთან, მაგალითად, მესამე ფაქტორის მოქმედების გამო.
განაცხადის არეალი
სტატისტიკური მონაცემების დამუშავების ეს მეთოდი ძალიან პოპულარულია ეკონომიკასა და სოციალურ მეცნიერებებში (კერძოდ, ფსიქოლოგიასა და სოციოლოგიაში), თუმცა კორელაციის კოეფიციენტების გამოყენების სფერო ფართოა: სამრეწველო პროდუქციის ხარისხის კონტროლი, მეტალურგია, სოფლის მეურნეობის ქიმია, ჰიდრობიოლოგია, ბიომეტრია, და სხვა.
მეთოდის პოპულარობა განპირობებულია ორი პუნქტით: კორელაციის კოეფიციენტების გამოთვლა შედარებით ადვილია, მათი გამოყენება არ საჭიროებს სპეციალურ მათემატიკურ მომზადებას. ინტერპრეტაციის სიმარტივესთან ერთად, კოეფიციენტის გამოყენების სიმარტივემ განაპირობა მისი ფართო გამოყენება სტატისტიკური მონაცემების ანალიზის სფეროში.
ყალბი კორელაცია
კორელაციური კვლევის ხშირად მაცდური სიმარტივე ხელს უწყობს მკვლევარს, გამოიტანოს ცრუ ინტუიციური დასკვნები წყვილთა ნიშან-თვისებებს შორის მიზეზობრივი კავშირის არსებობის შესახებ, მაშინ როცა კორელაციის კოეფიციენტები ადგენენ მხოლოდ სტატისტიკურ კავშირებს.
სოციალურ მეცნიერებათა თანამედროვე რაოდენობრივ მეთოდოლოგიაში, ფაქტობრივად, მიტოვებული იქნა დაკვირვებულ ცვლადებს შორის მიზეზობრივი კავშირის ემპირიული მეთოდებით დადგენის მცდელობები. ამიტომ, როდესაც სოციალური მეცნიერებების მკვლევარები საუბრობენ მათ მიერ შესწავლილ ცვლადებს შორის ურთიერთობის დამყარებაზე, იგულისხმება ან ზოგადი თეორიული დაშვება ან სტატისტიკური დამოკიდებულება.
იხილეთ ასევე
- ავტოკორელაციის ფუნქცია
- ჯვარედინი კორელაციის ფუნქცია
- კოვარიანტობა
- განსაზღვრის კოეფიციენტი
- Რეგრესიული ანალიზი
ფონდი ვიკიმედია. 2010 წელი.
სხვადასხვა ფუნქციები შეიძლება იყოს დაკავშირებული.
მათ შორის არსებობს 2 ტიპის კავშირი:
- ფუნქციური;
- კორელაცია.
კორელაციარუსულად ნათარგმნი - სხვა არაფერი, თუ არა კავშირი.
კორელაციის შემთხვევაში, არსებობს ერთი ატრიბუტის რამდენიმე მნიშვნელობის შესაბამისობა სხვა ატრიბუტის რამდენიმე მნიშვნელობასთან. როგორც მაგალითები, ჩვენ შეგვიძლია განვიხილოთ დადგენილი კორელაციები:
- თათების, კისრის, წვერის სიგრძე ფრინველებში, როგორიცაა ყანჩა, წერო, ღერო;
- სხეულის ტემპერატურისა და გულისცემის მაჩვენებლები.
ბიოსამედიცინო პროცესების უმეტესობისთვის, ამ ტიპის კავშირის არსებობა სტატისტიკურად დადასტურებულია.
სტატისტიკური მეთოდები შესაძლებელს ხდის დადგინდეს თვისებათა ურთიერთდამოკიდებულების არსებობის ფაქტი. ამისათვის სპეციალური გამოთვლების გამოყენება იწვევს კორელაციის კოეფიციენტების (დაკავშირების ზომების) დადგენას.
ასეთ გამოთვლებს ე.წ კორელაციის ანალიზი.ტარდება 2 ცვლადის (შემთხვევითი ცვლადის) ერთმანეთზე დამოკიდებულების დასადასტურებლად, რაც გამოიხატება კორელაციის კოეფიციენტით.
კორელაციის მეთოდის გამოყენება საშუალებას გვაძლევს გადავჭრათ რამდენიმე პრობლემა:
- გაანალიზებულ პარამეტრებს შორის კავშირის დადგენა;
- კორელაციის არსებობის ცოდნა იძლევა პროგნოზირების პრობლემების გადაჭრის საშუალებას. ამრიგად, არსებობს სხვა კორელირებული პარამეტრის ქცევის ანალიზის საფუძველზე პარამეტრის ქცევის პროგნოზირების რეალური შესაძლებლობა;
- კლასიფიკაცია ერთმანეთისგან დამოუკიდებელი მახასიათებლების შერჩევის საფუძველზე.
ცვლადებისთვის:
- რიგით სკალასთან დაკავშირებით გამოითვლება სპირმენის კოეფიციენტი;
- ინტერვალის სკალასთან დაკავშირებული - პირსონის კოეფიციენტი.
ეს არის ყველაზე ხშირად გამოყენებული პარამეტრები, მაგრამ არის სხვა.
კოეფიციენტის მნიშვნელობა შეიძლება გამოიხატოს როგორც დადებითი, ასევე უარყოფითი.
პირველ შემთხვევაში, ერთი ცვლადის მნიშვნელობის მატებასთან ერთად, შეინიშნება მეორის ზრდა. უარყოფითი კოეფიციენტით, ნიმუში შებრუნებულია.
რისთვის არის კორელაციის კოეფიციენტი?
ერთმანეთთან დაკავშირებულ შემთხვევით ცვლადებს შეიძლება ჰქონდეთ ამ კავშირის სრულიად განსხვავებული ბუნება. ის სულაც არ იქნება ფუნქციონალური, შემთხვევა, როცა რაოდენობებს შორის პირდაპირი კავშირია. ყველაზე ხშირად, ორივე რაოდენობაზე გავლენას ახდენს სხვადასხვა ფაქტორების მთელი ნაკრები, იმ შემთხვევებში, როდესაც ისინი საერთოა ორივე რაოდენობისთვის, შეინიშნება დაკავშირებული შაბლონების ფორმირება.
ეს ნიშნავს, რომ რაოდენობებს შორის კავშირის არსებობის სტატისტიკურად დადასტურებული ფაქტი არ არის იმის დადასტურება, რომ დაფიქსირებული ცვლილებების მიზეზი დადგინდა. როგორც წესი, მკვლევარი ასკვნის, რომ არსებობს ორი ურთიერთდაკავშირებული შედეგი.
კორელაციის კოეფიციენტის თვისებები
ამ სტატისტიკას აქვს შემდეგი თვისებები:
- კოეფიციენტის მნიშვნელობა მერყეობს -1-დან +1-მდე. რაც უფრო ახლოს არის უკიდურეს მნიშვნელობებთან, მით უფრო ძლიერია დადებითი ან უარყოფითი კავშირი ხაზოვან პარამეტრებს შორის. ნულოვანი მნიშვნელობის შემთხვევაში ვსაუბრობთ მახასიათებლებს შორის კორელაციის არარსებობაზე;
- კოეფიციენტის დადებითი მნიშვნელობა მიუთითებს იმაზე, რომ ერთი ატრიბუტის მნიშვნელობის გაზრდის შემთხვევაში შეინიშნება მეორის ზრდა (დადებითი კორელაცია);
- უარყოფითი მნიშვნელობა - ერთი ატრიბუტის მნიშვნელობის გაზრდის შემთხვევაში შეინიშნება მეორის კლება (უარყოფითი კორელაცია);
- ინდიკატორის მნიშვნელობის მიახლოება უკიდურეს წერტილებამდე (ან -1 ან +1) მიუთითებს ძალიან ძლიერი წრფივი ურთიერთობის არსებობაზე;
- თვისების ინდიკატორები შეიძლება შეიცვალოს კოეფიციენტის მუდმივი მნიშვნელობით;
- კორელაციის კოეფიციენტი არის განზომილებიანი სიდიდე;
- კორელაციის არსებობა არ არის მიზეზობრივი კავშირის სავალდებულო დადასტურება.
კორელაციის კოეფიციენტების მნიშვნელობები
კორელაციის სიძლიერე შეიძლება დახასიათდეს ჩელდოკის სკალის გამოყენებით, რომელშიც ხარისხობრივი მახასიათებელი შეესაბამება გარკვეულ რიცხვობრივ მნიშვნელობას.
მნიშვნელობაზე დადებითი კორელაციის შემთხვევაში:
- 0-0.3 - კორელაცია ძალიან სუსტია;
- 0,3-0,5 - სუსტი;
- 0,5-0,7 - საშუალო სიძლიერე;
- 0,7-0,9 - მაღალი;
- 0.9-1 - ძალიან მაღალი კორელაციის სიძლიერე.
სკალა ასევე შეიძლება გამოყენებულ იქნას უარყოფითი კორელაციისთვის. ამ შემთხვევაში, ხარისხობრივი მახასიათებლები იცვლება საპირისპიროებით.
თქვენ შეგიძლიათ გამოიყენოთ გამარტივებული ჩელდოკის სკალა, რომელშიც განასხვავებენ კორელაციის სიძლიერის მხოლოდ 3 გრადაციას:
- ძალიან ძლიერი - მაჩვენებლები ± 0.7 - ± 1;
- საშუალო - მაჩვენებლები ± 0,3 - ± 0,699;
- ძალიან სუსტი - მაჩვენებლები 0 - ± 0.299.
ეს სტატისტიკური მაჩვენებელი საშუალებას იძლევა არა მხოლოდ შეამოწმოს ვარაუდი მახასიათებლებს შორის წრფივი ურთიერთობის არსებობის შესახებ, არამედ დაადგინოს მისი სიძლიერე.
კორელაციის კოეფიციენტის სახეები
კორელაციის კოეფიციენტები შეიძლება კლასიფიცირდეს ნიშნით და მნიშვნელობით:
- დადებითი;
- null;
- უარყოფითი.
გაანალიზებული მნიშვნელობებიდან გამომდინარე, კოეფიციენტი გამოითვლება:
- პირსონი;
- შუბოსანი;
- კენდალა;
- ფეხნერის ნიშნები;
- თანხვედრა ან მრავალჯერადი რანგის კორელაცია.
პირსონის კორელაციის კოეფიციენტი გამოიყენება ცვლადების აბსოლუტურ მნიშვნელობებს შორის პირდაპირი კავშირის დასამყარებლად. ამ შემთხვევაში, ცვლადების ორივე სერიის განაწილება უნდა მიუახლოვდეს ნორმას. შედარებული ცვლადები უნდა განსხვავდებოდეს განსხვავებული მახასიათებლების იგივე რაოდენობით. ცვლადების შემცველი სკალა უნდა იყოს ან ინტერვალის სკალა ან თანაფარდობის მასშტაბი.
- კორელაციის სიძლიერის ზუსტი დადგენა;
- რაოდენობრივი მახასიათებლების შედარება.
პირსონის წრფივი კორელაციის კოეფიციენტის გამოყენებას რამდენიმე უარყოფითი მხარე აქვს:
- მეთოდი არასტაბილურია რიცხვითი მნიშვნელობების გამოკვეთის შემთხვევაში;
- ამ მეთოდის გამოყენებით შესაძლებელია კორელაციის სიძლიერის დადგენა მხოლოდ წრფივი ურთიერთობისთვის, ცვლადების ურთიერთდამოკიდებულების სხვა ტიპებისთვის გამოყენებული უნდა იყოს რეგრესიული ანალიზის მეთოდები.
რანგის კორელაცია განისაზღვრება სპირმანის მეთოდით, რაც შესაძლებელს ხდის ფენომენებს შორის კავშირის სტატისტიკურად შესწავლას. ამ კოეფიციენტის წყალობით გამოითვლება რაოდენობრივად გამოხატული ორი მახასიათებლის სერიის ფაქტობრივი პარალელურობის ხარისხი და ასევე შეფასებულია გამოვლენილი ურთიერთობის სიახლოვე.
- არ საჭიროებს კორელაციის სიძლიერის მნიშვნელობის ზუსტ განმარტებას;
- შედარებულ ინდიკატორებს აქვთ როგორც რაოდენობრივი, ასევე ატრიბუტული მნიშვნელობები;
- მახასიათებლების რიგების შედარება მნიშვნელობების ღია ვარიანტებთან.
Spearman-ის მეთოდი ეხება არაპარამეტრული ანალიზის მეთოდებს, ამიტომ არ არის საჭირო ფუნქციების განაწილების ნორმალურობის შემოწმება. გარდა ამისა, ის საშუალებას გაძლევთ შეადაროთ სხვადასხვა მასშტაბით გამოხატული ინდიკატორები. მაგალითად, სისხლის წითელი უჯრედების რაოდენობის შედარება სისხლის გარკვეულ მოცულობაში (უწყვეტი მასშტაბი) და ექსპერტის შეფასება, გამოხატული ქულებით (რიგობითი მასშტაბი).
მეთოდის ეფექტურობაზე უარყოფითად მოქმედებს დიდი განსხვავება შედარებული მნიშვნელობების მნიშვნელობებს შორის. მეთოდი ასევე არაეფექტურია იმ შემთხვევებში, როდესაც გაზომილი მნიშვნელობა ხასიათდება მნიშვნელობების არათანაბარი განაწილებით.
კორელაციის კოეფიციენტის ეტაპობრივი გაანგარიშება Excel-ში
კორელაციის კოეფიციენტის გამოთვლა გულისხმობს რიგი მათემატიკური მოქმედებების თანმიმდევრულ შესრულებას.
პირსონის კოეფიციენტის გამოსათვლელი ზემოხსენებული ფორმულა გვიჩვენებს, თუ რამდენად შრომატევადია ეს პროცესი, თუკი კეთდება ხელით.
Excell-ის შესაძლებლობების გამოყენება აჩქარებს კოეფიციენტის პოვნის პროცესს დროდადრო.
საკმარისია დაიცვას მოქმედებების მარტივი ალგორითმი:
- ძირითადი ინფორმაციის დანერგვა - x მნიშვნელობების სვეტი და y მნიშვნელობების სვეტი;
- ხელსაწყოებში შეირჩევა და იხსნება ფორმულების ჩანართი;
- ჩანართში, რომელიც იხსნება, აირჩიეთ "Insert fx ფუნქცია";
- დიალოგურ ფანჯარაში, რომელიც იხსნება, არჩეულია სტატისტიკური ფუნქცია "Correl", რომელიც საშუალებას გაძლევთ გამოთვალოთ კორელაციის კოეფიციენტი 2 მონაცემთა მასივს შორის;
- მონაცემები შეიყვანება ფანჯარაში, რომელიც იხსნება: მასივი 1 - x სვეტის მნიშვნელობების დიაპაზონი (მონაცემები არჩეული უნდა იყოს), მასივი 2 - y სვეტის მნიშვნელობების დიაპაზონი;
- დააჭირეთ ღილაკს "OK", კოეფიციენტის გამოთვლის შედეგი გამოჩნდება "მნიშვნელობის" ხაზში;
- დასკვნა 2 მონაცემთა ნაკრებისა და მის სიძლიერეს შორის კორელაციის არსებობის შესახებ.
კორელაციის მოდელი (CM) არის გაანგარიშების პროგრამა, რომელიც უზრუნველყოფს მათემატიკურ განტოლებას, რომელშიც მიღებული ინდიკატორი რაოდენობრივად განისაზღვრება ერთი ან მეტი ინდიკატორის მიხედვით.
yx \u003d ao + a1x1
სადაც: y - შესრულების მაჩვენებელი, x ფაქტორიდან გამომდინარე;
x - ფაქტორის ნიშანი;
a1 - პარამეტრი KM, რომელიც აჩვენებს, თუ რამდენად შეიცვლება y ეფექტური მაჩვენებელი, როდესაც x ფაქტორი იცვლება ერთით, თუ ამავდროულად y-ზე მოქმედი ყველა სხვა ფაქტორი უცვლელი რჩება;
ao - პარამეტრი KM, რომელიც აჩვენებს ყველა სხვა ფაქტორების გავლენას ეფექტურ ინდიკატორზე y, გარდა x ფაქტორის ნიშნისა.
მოდელის ეფექტური და ფაქტორული ინდიკატორების არჩევისას აუცილებელია გავითვალისწინოთ ის ფაქტი, რომ მიზეზ-შედეგობრივი კავშირების ჯაჭვში ეფექტური მაჩვენებელი უფრო მაღალ დონეზეა, ვიდრე ფაქტორების მაჩვენებლები.
კორელაციის მოდელის მახასიათებლები
კორელაციის მოდელის პარამეტრების გაანგარიშების შემდეგ გამოითვლება კორელაციის კოეფიციენტი.
p - წყვილის კორელაციის კოეფიციენტი, -1 ≤ p ≤ 1, გვიჩვენებს ფაქტორის ინდიკატორის გავლენის სიძლიერეს და მიმართულებას ეფექტურზე. რაც უფრო ახლოს არის 1-თან, მით უფრო ძლიერია ურთიერთობა, რაც უფრო ახლოს არის 0-თან, მით უფრო სუსტია ურთიერთობა. თუ კორელაციის კოეფიციენტი დადებითია, მაშინ ურთიერთობა პირდაპირია, თუ უარყოფითია, შებრუნებულია.
კორელაციის კოეფიციენტის ფორმულა: pxy \u003d (xy-x * 1 / y) / eh * eu
ex=xx2-(x)2; eu=y2-(y)2
თუ CM არის წრფივი მრავალფაქტორიანი, რომელსაც აქვს ფორმა:
yx \u003d ao + a1x1 + a2x2 + ... + axp
შემდეგ მისთვის გამოითვლება მრავალჯერადი კორელაციის კოეფიციენტი.
0 ≤ Р ≤ 1 და აჩვენებს ყველა ფაქტორის ინდიკატორის გავლენის სიძლიერეს ეფექტურზე.
P \u003d 1- ((uh-uy) 2 / (yi - usr) 2)
სად: uh - ეფექტური მაჩვენებელი - გამოთვლილი მნიშვნელობა;
ui - ფაქტობრივი მნიშვნელობა;
usr - ფაქტობრივი ღირებულება, საშუალო.
გამოთვლილი მნიშვნელობა yx მიიღება კორელაციის მოდელში ჩანაცვლების შედეგად x1, x2 და ა.შ. მათი რეალური ღირებულებები.
ერთფაქტორიანი და მრავალფაქტორიანი არაწრფივი მოდელებისთვის, კორელაციის თანაფარდობა გამოითვლება:
1 ≤ მ ≤ 1;
მიჩნეულია, რომ მოდელში შემავალ ეფექტურ და ფაქტორულ ინდიკატორებს შორის კავშირი სუსტია, თუ კავშირის სიახლოვის კოეფიციენტის მნიშვნელობა (მ) არის 0-0.3 ფარგლებში; თუ 0.3-0.7 - კავშირის სიმჭიდროვე საშუალოა; 0.7-1 ზემოთ - კავშირი ძლიერია.
ვინაიდან კორელაციის კოეფიციენტი (დაწყვილებული) p, კორელაციის კოეფიციენტი (მრავალჯერადი) P, კორელაციის კოეფიციენტი m არის ალბათური მნიშვნელობები, მაშინ მათთვის გამოითვლება მათი მნიშვნელოვნების კოეფიციენტები (განსაზღვრულია ცხრილებიდან). თუ ეს კოეფიციენტები აღემატება მათ ცხრილის მნიშვნელობას, მაშინ კავშირის სიახლოვის კოეფიციენტები მნიშვნელოვანი მიზეზებია. თუ კავშირის სიმჭიდროვის მნიშვნელოვნების კოეფიციენტები ნაკლებია ცხრილის მნიშვნელობებზე, ან თუ კავშირის კოეფიციენტი 0,7-ზე ნაკლებია, მაშინ მოდელში არ შედის ყველა ფაქტორის ინდიკატორი, რომელიც მნიშვნელოვნად მოქმედებს შედეგზე.
დეტერმინაციის კოეფიციენტი ნათლად აჩვენებს მოდელში შემავალი ფაქტორების ინდიკატორების პროცენტულ მაჩვენებელს, რომელიც განსაზღვრავს შედეგის ფორმირებას.
თუ განსაზღვრის კოეფიციენტი 50-ზე მეტია, მაშინ მოდელი ადეკვატურად აღწერს შესასწავლ პროცესს, თუ ის 50-ზე ნაკლებია, მაშინ აუცილებელია მშენებლობის პირველ ეტაპზე დაბრუნება და ფაქტორების ინდიკატორების შერჩევის გადახედვა. მოდელი.
ფიშერის კოეფიციენტი ან ფიშერის კრიტერიუმი ახასიათებს მოდელის მთლიანობაში ეფექტურობას. თუ კოეფიციენტის გამოთვლილი მნიშვნელობა აღემატება ცხრილის მნიშვნელობას, მაშინ აშენებული მოდელი შესაფერისია ანალიზისთვის, ასევე დაგეგმვის ინდიკატორებისთვის, გამოთვლებისთვის მომავლისთვის. სავარაუდო ცხრილის მნიშვნელობა \u003d 1.5. თუ გამოთვლილი მნიშვნელობა ნაკლებია ცხრილის მნიშვნელობაზე, პირველ რიგში აუცილებელია მოდელის აგება, მათ შორის ფაქტორები, რომლებიც მნიშვნელოვნად მოქმედებს შედეგზე. მთლიანობაში მოდელის ეფექტურობის გარდა, თითოეული რეგრესიის კოეფიციენტი გავლენას ახდენს მატერიალურობაზე. თუ ამ კოეფიციენტის გამოთვლილმა მნიშვნელობამ გადააჭარბა ცხრილის მნიშვნელობას, მაშინ რეგრესიის კოეფიციენტი იქნება მნიშვნელოვანი, თუ ის ნაკლებია, მაშინ ფაქტორული მაჩვენებელი, რომლისთვისაც ეს კოეფიციენტი გამოითვლება, ამოღებულია ნიმუშიდან, გამოთვლები იწყება თავიდან, მაგრამ ამ ფაქტორის გარეშე. .
კორელაციის კოეფიციენტი არის ორ ცვლადს შორის კავშირის ხარისხი. მისი გაანგარიშება იძლევა წარმოდგენას იმის შესახებ, არის თუ არა კავშირი მონაცემთა ორ ნაკრებს შორის. რეგრესიისგან განსხვავებით, კორელაცია არ იძლევა მნიშვნელობების პროგნოზირების საშუალებას. თუმცა, კოეფიციენტის გამოთვლა მნიშვნელოვანი ნაბიჯია წინასწარი სტატისტიკური ანალიზის დროს. მაგალითად, ჩვენ აღმოვაჩინეთ, რომ პირდაპირი უცხოური ინვესტიციების დონესა და მშპ-ს ზრდას შორის კორელაციის კოეფიციენტი მაღალია. ეს გვაძლევს წარმოდგენას, რომ კეთილდღეობის უზრუნველსაყოფად საჭიროა სპეციალურად უცხოელი მეწარმეებისთვის ხელსაყრელი კლიმატის შექმნა. არც ისე აშკარა დასკვნა ერთი შეხედვით!
კორელაცია და მიზეზობრიობა
შესაძლოა, არ არსებობს სტატისტიკის არც ერთი სფერო, რომელიც ასე მტკიცედ დამკვიდრდება ჩვენს ცხოვრებაში. კორელაციის კოეფიციენტი გამოიყენება საზოგადოების ცოდნის ყველა სფეროში. მისი მთავარი საშიშროება მდგომარეობს იმაში, რომ ხშირად მის მაღალ ფასეულობებზე ვარაუდობენ, რათა დაარწმუნონ ადამიანები და დააჯერონ გარკვეული დასკვნები. თუმცა, ფაქტობრივად, ძლიერი კორელაცია საერთოდ არ მიუთითებს რაოდენობებს შორის მიზეზობრივ კავშირზე.
კორელაციის კოეფიციენტი: პირსონის და სპირმანის ფორმულა
არსებობს რამდენიმე ძირითადი ინდიკატორი, რომელიც ახასიათებს ორ ცვლადს შორის ურთიერთობას. ისტორიულად, პირველი არის პირსონის წრფივი კორელაციის კოეფიციენტი. სკოლაში გადის. იგი შეიმუშავეს კ. პირსონმა და ჯ. იულმა ფრ. გალტონი. ეს კოეფიციენტი საშუალებას გაძლევთ ნახოთ რაციონალურ რიცხვებს შორის ურთიერთობა, რომლებიც რაციონალურად იცვლება. ის ყოველთვის მეტია -1-ზე და 1-ზე ნაკლები. უარყოფითი რიცხვი მიუთითებს უკუპროპორციულ ურთიერთობაზე. თუ კოეფიციენტი ნულია, მაშინ ცვლადებს შორის კავშირი არ არის. დადებითი რიცხვის ტოლია - შესწავლილ სიდიდეებს შორის არის პირდაპირპროპორციული კავშირი. Spearman-ის რანგის კორელაციის კოეფიციენტი შესაძლებელს ხდის გამოთვლების გამარტივებას ცვლადი მნიშვნელობების იერარქიის აგებით.
ცვლადებს შორის ურთიერთობა
კორელაცია ეხმარება ორ კითხვაზე პასუხის გაცემას. პირველი, ცვლადებს შორის კავშირი დადებითია თუ უარყოფითი. მეორეც, რამდენად ძლიერია დამოკიდებულება. კორელაციური ანალიზი არის ძლიერი ინსტრუმენტი, რომლითაც მივიღებთ ამ მნიშვნელოვან ინფორმაციას. ადვილი მისახვედრია, რომ ოჯახის შემოსავლები და ხარჯები პროპორციულად იზრდება და მცირდება. ასეთი ურთიერთობა დადებითად ითვლება. პირიქით, როცა პროდუქტის ფასი იზრდება, მასზე მოთხოვნა ეცემა. ასეთ ურთიერთობას ნეგატიური ეწოდება. კორელაციის კოეფიციენტის მნიშვნელობები არის -1-დან 1-მდე. ნული ნიშნავს, რომ არ არსებობს კავშირი შესწავლილ მნიშვნელობებს შორის. რაც უფრო ახლოს არის მაჩვენებელი უკიდურეს მნიშვნელობებთან, მით უფრო ძლიერია ურთიერთობა (ნეგატიური ან დადებითი). დამოკიდებულების არარსებობა დასტურდება კოეფიციენტით -0.1-დან 0.1-მდე. უნდა გვესმოდეს, რომ ასეთი მნიშვნელობა მხოლოდ ხაზოვანი ურთიერთობის არარსებობაზე მიუთითებს.
აპლიკაციის მახასიათებლები
ორივე ინდიკატორის გამოყენება გარკვეულ ვარაუდებს ექვემდებარება. პირველი, ძლიერი ურთიერთობის არსებობა არ განსაზღვრავს იმ ფაქტს, რომ ერთი ღირებულება განსაზღვრავს მეორეს. შეიძლება არსებობდეს მესამე რაოდენობა, რომელიც განსაზღვრავს თითოეულ მათგანს. მეორეც, პირსონის მაღალი კორელაციის კოეფიციენტი არ მიუთითებს მიზეზობრივ კავშირზე შესწავლილ ცვლადებს შორის. მესამე, ის აჩვენებს ექსკლუზიურად ხაზოვან ურთიერთობას. კორელაცია შეიძლება გამოყენებულ იქნას მნიშვნელოვანი რაოდენობრივი მონაცემების შესაფასებლად (მაგ. ბარომეტრული წნევა, ჰაერის ტემპერატურა) და არა ისეთი კატეგორიების, როგორიცაა სქესი ან საყვარელი ფერი.
მრავალჯერადი კორელაციის კოეფიციენტი
პირსონმა და სპირმანმა გამოიკვლიეს ურთიერთობა ორ ცვლადს შორის. მაგრამ რა უნდა გააკეთოს, თუ სამი ან მეტი მათგანია. აქ მოდის მრავალჯერადი კორელაციის კოეფიციენტი. მაგალითად, მთლიან ეროვნულ პროდუქტზე გავლენას ახდენს არა მხოლოდ პირდაპირი უცხოური ინვესტიციები, არამედ სახელმწიფოს მონეტარული და ფისკალური პოლიტიკა, ასევე ექსპორტის დონე. ზრდის ტემპი და მთლიანი შიდა პროდუქტის მოცულობა მთელი რიგი ფაქტორების ურთიერთქმედების შედეგია. თუმცა, უნდა გვესმოდეს, რომ მრავალჯერადი კორელაციის მოდელი ეფუძნება რიგ გამარტივებებსა და ვარაუდებს. უპირველეს ყოვლისა, გამორიცხულია მულტიკოლინეარულობა რაოდენობებს შორის. მეორე, დამოკიდებულება დამოკიდებულ ცვლადსა და მასზე მოქმედ ცვლადებს შორის ნავარაუდევია წრფივი.
კორელაციისა და რეგრესიული ანალიზის გამოყენების სფეროები
რაოდენობებს შორის კავშირის პოვნის ეს მეთოდი ფართოდ გამოიყენება სტატისტიკაში. მას ყველაზე ხშირად მიმართავენ სამ ძირითად შემთხვევაში:
- ორი ცვლადის მნიშვნელობებს შორის მიზეზობრივი ურთიერთობების შესამოწმებლად. შედეგად, მკვლევარი იმედოვნებს, რომ იპოვის წრფივ ურთიერთობას და გამოიმუშავებს ფორმულას, რომელიც აღწერს ამ კავშირებს რაოდენობას შორის. მათი საზომი ერთეულები შეიძლება განსხვავებული იყოს.
- ღირებულებებს შორის კავშირის შესამოწმებლად. ამ შემთხვევაში არავინ განსაზღვრავს რომელი ცვლადია დამოკიდებული. შეიძლება აღმოჩნდეს, რომ ორივე რაოდენობის ღირებულება განსაზღვრავს სხვა ფაქტორს.
- განტოლების გამოყვანა. ამ შემთხვევაში, თქვენ შეგიძლიათ უბრალოდ ჩაანაცვლოთ რიცხვები მასში და გაარკვიოთ უცნობი ცვლადის მნიშვნელობები.
კაცი მიზეზობრივი ურთიერთობის ძიებაში
ცნობიერება ისეა მოწყობილი, რომ აუცილებლად უნდა ავხსნათ ირგვლივ მომხდარი მოვლენები. ადამიანი ყოველთვის ეძებს კავშირს იმ სამყაროს სურათს, რომელშიც ის ცხოვრობს და მიღებულ ინფორმაციას შორის. ხშირად ტვინი ქმნის წესრიგს ქაოსისგან. ის ადვილად ხედავს მიზეზშედეგობრივ ურთიერთობას იქ, სადაც არ არის. მეცნიერებმა კონკრეტულად უნდა ისწავლონ ამ ტენდენციის გადალახვა. მონაცემებს შორის ურთიერთობის შეფასების უნარი ობიექტურად აუცილებელია აკადემიურ კარიერაში.
მედიის მიკერძოება
იფიქრეთ იმაზე, თუ როგორ შეიძლება არასწორად იქნას განმარტებული კორელაციის არსებობა. ბრიტანელი სტუდენტების ჯგუფს ჰკითხეს, ეწევათ თუ არა მათი მშობლები. შემდეგ ტესტი გამოქვეყნდა გაზეთში. შედეგმა აჩვენა ძლიერი კორელაცია მშობლების მოწევასა და მათი შვილების დანაშაულს შორის. პროფესორმა, რომელმაც ეს კვლევა ჩაატარა, შესთავაზა სიგარეტის კოლოფებზე ამის შესახებ გაფრთხილება. თუმცა, ამ დასკვნასთან დაკავშირებით რამდენიმე პრობლემაა. პირველი, კორელაცია არ მიუთითებს, თუ რომელი რაოდენობაა დამოუკიდებელი. აქედან გამომდინარე, სავსებით შესაძლებელია ვივარაუდოთ, რომ მშობლების მავნე ჩვევა გამოწვეულია ბავშვების დაუმორჩილებლობით. მეორეც, დარწმუნებით შეუძლებელია იმის თქმა, რომ ორივე პრობლემა არ წარმოიშვა რომელიმე მესამე ფაქტორის გამო. მაგალითად, დაბალი შემოსავლის მქონე ოჯახები. უნდა აღინიშნოს კვლევის ჩატარების პროფესორის თავდაპირველი დასკვნების ემოციური ასპექტი. ის მოწევის მწვავე მოწინააღმდეგე იყო. აქედან გამომდინარე, გასაკვირი არ არის, რომ მან თავისი კვლევის შედეგები ასე განმარტა.
დასკვნები
კორელაციის არასწორ ინტერპრეტაციას, როგორც ორ ცვლადს შორის მიზეზობრივ კავშირს, შეიძლება გამოიწვიოს უხერხული კვლევის შეცდომები. პრობლემა ის არის, რომ ის დევს ადამიანის ცნობიერების ძირში. ბევრი მარკეტინგული ხრიკი ეფუძნება ამ ფუნქციას. მიზეზობრიობასა და კორელაციას შორის განსხვავების გაგება საშუალებას გაძლევთ რაციონალურად გააანალიზოთ ინფორმაცია როგორც ყოველდღიურ ცხოვრებაში, ასევე თქვენს პროფესიულ კარიერაში.