Apa itu korelasi dalam statistik. Koefisien korelasi merupakan karakteristik dari model korelasi. Bagaimana menginterpretasikan nilai koefisien korelasi Pearson
» Statistik
Statistik dan pemrosesan data dalam psikologi
(kelanjutan)
Analisis korelasi
Saat belajar korelasi coba tentukan apakah ada hubungan antara dua indikator dalam sampel yang sama (misalnya, antara tinggi dan berat badan anak atau antara tingkat IQ dan kinerja sekolah) atau antara dua sampel yang berbeda (misalnya, ketika membandingkan pasangan kembar), dan jika ada hubungan ini, apakah peningkatan salah satu indikator disertai dengan peningkatan (korelasi positif) atau penurunan (korelasi negatif) dari lainnya.
Dengan kata lain, analisis korelasi membantu menentukan apakah mungkin memprediksi nilai yang mungkin dari satu indikator, mengetahui nilai indikator lainnya.
Hingga saat ini, saat menganalisis hasil pengalaman kami mempelajari efek ganja, kami sengaja mengabaikan indikator seperti waktu reaksi. Sementara itu, akan menarik untuk memeriksa apakah ada hubungan antara efisiensi reaksi dan kecepatannya. Ini akan memungkinkan, misalnya, untuk menyatakan bahwa semakin lambat seseorang, semakin akurat dan efektif tindakannya dan sebaliknya.
Untuk tujuan ini, dua metode berbeda dapat digunakan: metode parametrik menghitung koefisien Bravais-Pearson (r) dan perhitungan koefisien korelasi peringkat Spearman (r s), yang diterapkan pada data ordinal, yaitu adalah non-parametrik. Namun, pertama-tama mari kita pahami apa itu koefisien korelasi.
Koefisien korelasi
Koefisien korelasi adalah nilai yang dapat bervariasi dari +1 hingga -1. Dalam kasus korelasi positif lengkap, koefisien ini sama dengan ditambah 1, dan dalam kasus korelasi negatif lengkap, dikurangi 1. Pada grafik, ini sesuai dengan garis lurus yang melewati titik-titik perpotongan dari nilai dari setiap pasangan data:
Jika titik-titik ini tidak berbaris dalam garis lurus, tetapi membentuk "awan", nilai absolut dari koefisien korelasi menjadi kurang dari satu dan mendekati nol saat awan membulat:
Jika koefisien korelasi adalah 0, kedua variabel benar-benar independen satu sama lain.
Dalam humaniora, korelasi dianggap kuat jika koefisiennya lebih besar dari 0,60; jika melebihi 0,90, maka korelasinya dianggap sangat kuat. Namun, untuk dapat menarik kesimpulan tentang hubungan antar variabel, ukuran sampel sangat penting: semakin besar sampel, semakin dapat diandalkan nilai koefisien korelasi yang diperoleh. Ada tabel dengan nilai kritis dari koefisien korelasi Bravais-Pearson dan Spearman untuk jumlah derajat kebebasan yang berbeda (sama dengan jumlah pasangan dikurangi 2, mis. n- 2). Hanya jika koefisien korelasi lebih besar dari nilai kritis ini, mereka dapat dianggap andal. Jadi, agar koefisien korelasi 0,70 dapat diandalkan, setidaknya 8 pasang data harus dimasukkan ke dalam analisis ( h = n-2=6) saat menghitung r (lihat Tabel 4 di Lampiran) dan 7 pasang data (h = n-2= 5) saat menghitung r s (Tabel 5 di Lampiran).
Saya ingin menekankan sekali lagi bahwa esensi dari kedua koefisien ini agak berbeda. Koefisien r negatif menunjukkan bahwa efisiensi paling sering semakin tinggi, semakin cepat waktu reaksi, sedangkan ketika menghitung koefisien r s perlu untuk memeriksa apakah subjek yang lebih cepat selalu bereaksi lebih akurat, dan subjek yang lebih lambat kurang akurat.
Koefisien korelasi Bravais-Pearson (r) - Ini adalah indikator parametrik, untuk perhitungan yang deviasi rata-rata dan standar dari hasil dua pengukuran dibandingkan. Dalam hal ini, rumus digunakan (mungkin terlihat berbeda untuk penulis yang berbeda)
dimana Σ XY- jumlah produk dari data dari masing-masing pasangan;
n adalah jumlah pasangan;
X - rata-rata untuk variabel tertentu x;
Y -
rata-rata untuk data variabel Y
Sx- standar deviasi untuk distribusi X;
Si- standar deviasi untuk distribusi pada
Koefisien korelasi peringkat Spearman ( rs ) - ini adalah indikator non-parametrik, dengan bantuan yang mereka coba ungkapkan hubungan antara jajaran kuantitas yang sesuai dalam dua rangkaian pengukuran.
Koefisien ini lebih mudah dihitung, tetapi hasilnya kurang akurat dibandingkan dengan menggunakan r. Hal ini disebabkan fakta bahwa saat menghitung koefisien Spearman, urutan data digunakan, dan bukan karakteristik kuantitatif dan interval antar kelas.
Faktanya adalah ketika menggunakan koefisien korelasi peringkat Spearman (r s), mereka hanya memeriksa apakah peringkat data untuk sampel apa pun akan sama dengan rangkaian data lain untuk sampel ini, terkait berpasangan dengan yang pertama (misalnya , apakah mereka akan di “ranking” sama oleh mahasiswa baik psikologi maupun matematika, atau bahkan dengan dua guru psikologi yang berbeda?). Jika koefisiennya mendekati +1, maka ini berarti kedua deret praktis bertepatan, dan jika koefisien ini mendekati -1, kita dapat berbicara tentang hubungan terbalik yang lengkap.
Koefisien rs dihitung menurut rumus
di mana d adalah perbedaan antara jajaran nilai fitur konjugasi (terlepas dari tandanya), dan adalah jumlah pasangan.
Biasanya, uji non-parametrik ini digunakan dalam kasus di mana Anda perlu menarik beberapa kesimpulan yang tidak terlalu penting interval antara data, berapa banyak tentang mereka peringkat, dan juga ketika kurva distribusi terlalu miring dan tidak memungkinkan penggunaan kriteria parametrik seperti koefisien r (dalam kasus ini mungkin perlu mengubah data kuantitatif menjadi data ordinal).
Ringkasan
Jadi, kami telah mempertimbangkan berbagai metode statistik parametrik dan non-parametrik yang digunakan dalam psikologi. Ulasan kami sangat dangkal, dan tugas utamanya adalah membuat pembaca memahami bahwa statistik tidak seseram kelihatannya, dan sebagian besar membutuhkan akal sehat. Kami mengingatkan Anda bahwa data "pengalaman" yang kami bahas di sini adalah fiktif dan tidak dapat dijadikan dasar untuk kesimpulan apa pun. Namun, eksperimen semacam itu layak dilakukan. Karena teknik murni klasik dipilih untuk percobaan ini, analisis statistik yang sama dapat digunakan dalam banyak percobaan yang berbeda. Bagaimanapun, bagi kami tampaknya kami telah menguraikan beberapa arahan utama yang mungkin berguna bagi mereka yang tidak tahu harus mulai dari mana analisis statistik hasil.
literatur
- Godefroy J. Apa itu psikologi. - M., 1992.
- Chatillon G., 1977. Statistique en Sciences humaines, Trois-Rivieres, Ed. SMG.
- Gilbert N. 1978. Statistik, Montreal, Ed. H.R.W.
- Moroney MJ, 1970. Memahami statistik, Verviers, Gerard et Cie.
- Siegel S., 1956. Statistik Nonparametrik, New York, MacGraw-Hill Book Co.
Aplikasi lembar kerja
Catatan. 1) Untuk sampel besar atau tingkat signifikansi kurang dari 0,05, lihat tabel di buku teks statistik.
2) Tabel nilai kriteria non parametrik lainnya dapat dilihat pada pedoman khusus (lihat daftar pustaka).
Tabel 1. Nilai kriteria t Murid | |
h | 0,05 |
1 | 6,31 |
2 | 2,92 |
3 | 2,35 |
4 | 2,13 |
5 | 2,02 |
6 | 1,94 |
7 | 1,90 |
8 | 1,86 |
9 | 1,83 |
10 | 1,81 |
11 | 1,80 |
12 | 1,78 |
13 | 1,77 |
14 | 1,76 |
15 | 1,75 |
16 | 1,75 |
17 | 1,74 |
18 | 1,73 |
19 | 1,73 |
20 | 1,73 |
21 | 1,72 |
22 | 1,72 |
23 | 1,71 |
24 | 1,71 |
25 | 1,71 |
26 | 1,71 |
27 | 1,70 |
28 | 1,70 |
29 | 1,70 |
30 | 1,70 |
40 | 1,68 |
¥ | 1,65 |
Tabel 2. Nilai kriteria χ 2 | |
h | 0,05 |
1 | 3,84 |
2 | 5,99 |
3 | 7,81 |
4 | 9,49 |
5 | 11,1 |
6 | 12,6 |
7 | 14,1 |
8 | 15,5 |
9 | 16,9 |
10 | 18,3 |
Tabel 3. Nilai Z yang reliabel | |
R | Z |
0,05 | 1,64 |
0,01 | 2,33 |
Tabel 4. Nilai r yang reliabel (kritis). | ||
h = (N-2) | p= 0,05 (5%) | |
3 | 0,88 | |
4 | 0,81 | |
5 | 0,75 | |
6 | 0,71 | |
7 | 0,67 | |
8 | 0,63 | |
9 | 0,60 | |
10 | 0,58 | |
11 | 0.55 | |
12 | 0,53 | |
13 | 0,51 | |
14 | 0,50 | |
15 | 0,48 | |
16 | 0,47 | |
17 | 0,46 | |
18 | 0,44 | |
19 | 0,43 | |
20 | 0,42 |
Tabel 5. Nilai reliabel (kritis) dari r s | |
h = (N-2) | p = 0,05 |
2 | 1,000 |
3 | 0,900 |
4 | 0,829 |
5 | 0,714 |
6 | 0,643 |
7 | 0,600 |
8 | 0,564 |
10 | 0,506 |
12 | 0,456 |
14 | 0,425 |
16 | 0,399 |
18 | 0,377 |
20 | 0,359 |
22 | 0,343 |
24 | 0,329 |
26 | 0,317 |
28 | 0,306 |
Koefisien korelasi adalah nilai yang dapat bervariasi dari +1 hingga -1. Dalam kasus korelasi positif lengkap, koefisien ini sama dengan plus 1 (mereka mengatakan bahwa dengan peningkatan nilai satu variabel, nilai variabel lain meningkat), dan dengan korelasi negatif lengkap - minus 1 (tunjukkan umpan balik , yaitu ketika nilai satu variabel meningkat, nilai variabel lainnya menurun).
Contoh 1:
Grafik ketergantungan rasa malu dan depresi. Seperti yang Anda lihat, titik-titik (subjek) tidak terletak secara acak, tetapi berbaris di sekitar satu garis, dan melihat garis ini, kita dapat mengatakan bahwa semakin tinggi rasa malu yang diekspresikan pada seseorang, semakin depresif, mis. saling berhubungan.
Contoh 2: Grafik untuk Rasa Malu dan Keramahan. Kami melihat bahwa saat rasa malu meningkat, kemampuan bersosialisasi menurun. Koefisien korelasi mereka adalah -0,43. Dengan demikian, koefisien korelasi yang lebih besar dari 0 hingga 1 menunjukkan hubungan berbanding lurus (semakin banyak ... semakin banyak ...), dan koefisien dari -1 hingga 0 menunjukkan hubungan berbanding terbalik (semakin banyak ... semakin sedikit . ..)
Jika koefisien korelasi adalah 0, kedua variabel benar-benar independen satu sama lain.
korelasi- ini adalah hubungan di mana pengaruh faktor individu hanya muncul sebagai tren (rata-rata) dengan pengamatan massal data aktual. Contoh ketergantungan korelasi dapat berupa ketergantungan antara besar kecilnya kekayaan bank dengan besarnya keuntungan bank, pertumbuhan produktivitas tenaga kerja dan lama masa kerja pegawai.
Dua sistem klasifikasi korelasi menurut kekuatannya digunakan: umum dan khusus.
Klasifikasi korelasi secara umum: 1) kuat, atau dekat dengan koefisien korelasi r> 0,70; 2) sedang pada 0.500,70, dan bukan hanya korelasi tingkat signifikansi tinggi.Tabel berikut mencantumkan nama koefisien korelasi untuk berbagai jenis skala.
Skala dikotomis (1/0) | Skala peringkat (ordinal). | ||
Skala dikotomis (1/0) | Koefisien asosiasi Pearson, koefisien konjugasi empat sel Pearson. | Korelasi biserial | |
Skala peringkat (ordinal). | Korelasi peringkat-biserial. | Koefisien korelasi peringkat Spearman atau Kendall. | |
Skala interval dan absolut | Korelasi biserial | Nilai-nilai skala interval diubah menjadi peringkat dan digunakan koefisien peringkat | Koefisien korelasi Pearson (koefisien korelasi linier) |
Pada r=0 tidak ada korelasi linier. Dalam hal ini, rata-rata kelompok variabel bertepatan dengan rata-rata umum mereka, dan garis regresi sejajar dengan sumbu koordinat.
Persamaan r=0 hanya berbicara tentang tidak adanya ketergantungan korelasi linier (variabel tidak berkorelasi), tetapi tidak secara umum tentang tidak adanya korelasi, dan terlebih lagi, ketergantungan statistik.
Terkadang kesimpulan bahwa tidak ada korelasi lebih penting daripada adanya korelasi yang kuat. Korelasi nol dari dua variabel dapat menunjukkan bahwa tidak ada pengaruh satu variabel terhadap variabel lainnya, asalkan kita mempercayai hasil pengukuran.
Di SPSS: 11.3.2 Koefisien korelasi
Hingga saat ini, kami hanya menemukan fakta adanya hubungan statistik antara dua fitur. Selanjutnya, kita akan mencoba mencari kesimpulan apa yang dapat ditarik tentang kekuatan atau kelemahan dari ketergantungan ini, serta tentang bentuk dan arahnya. Kriteria untuk mengukur hubungan antar variabel disebut koefisien korelasi atau ukuran konektivitas. Dua variabel berkorelasi positif jika ada hubungan langsung dan searah di antara keduanya. Dalam hubungan searah, nilai kecil dari satu variabel sesuai dengan nilai kecil dari variabel lain, nilai besar sesuai dengan nilai besar. Dua variabel berkorelasi negatif jika ada hubungan terbalik antara mereka. Dengan hubungan multi arah, nilai kecil dari satu variabel sesuai dengan nilai besar dari variabel lain dan sebaliknya. Nilai koefisien korelasi selalu berkisar antara -1 hingga +1.
Koefisien Spearman digunakan sebagai koefisien korelasi antar variabel yang termasuk dalam skala ordinal, dan koefisien korelasi Pearson (momen produk) digunakan untuk variabel yang termasuk dalam skala interval. Dalam hal ini, perlu dicatat bahwa setiap variabel dikotomis, yaitu variabel yang termasuk dalam skala nominal dan memiliki dua kategori, dapat dianggap ordinal.
Pertama, kita akan mengecek apakah ada korelasi antara variabel sex dan psyche dari file studium.sav. Dalam melakukannya, kami memperhitungkan bahwa variabel dikotomis seks dapat dianggap sebagai variabel ordinal. Lakukan hal berikut:
Pilih dari menu perintah Analisis (Analisis) Statistik Deskriptif (Statistik deskriptif) Tab silang... (Tabel kontingensi)
· Pindahkan variabel sex ke daftar baris dan variabel psyche ke daftar kolom.
· Klik tombol Statistik.... Dalam tab silang: dialog Statistik, centang kotak Korelasi. Konfirmasikan pilihan Anda dengan tombol Lanjutkan.
· Dalam dialog Crosstabs, hentikan tampilan tabel dengan mencentang kotak Supress tables. Klik tombol OK.
Koefisien korelasi Spearman dan Pearson akan dihitung, dan signifikansinya akan diuji:
/ SPSS 10
Tugas nomor 10 Analisis korelasi
Konsep korelasi
Korelasi atau koefisien korelasi adalah indikator statistik probabilistik hubungan antara dua variabel yang diukur pada skala kuantitatif. Berbeda dengan koneksi fungsional, di mana setiap nilai dari satu variabel sesuai didefinisikan secara ketat nilai variabel lain, koneksi probabilistik dicirikan oleh fakta bahwa setiap nilai dari satu variabel sesuai dengan seperangkat nilai Variabel lain, Contoh hubungan probabilistik adalah hubungan antara tinggi dan berat badan orang. Jelas bahwa orang dengan bobot berbeda dapat memiliki tinggi yang sama dan sebaliknya.
Korelasi adalah nilai antara -1 dan +1 dan dilambangkan dengan huruf r. Apalagi jika nilainya mendekati 1, maka ini berarti adanya koneksi yang kuat, dan jika mendekati 0, maka koneksi lemah. Nilai korelasi kurang dari 0,2 dianggap sebagai korelasi lemah, lebih dari 0,5 - tinggi. Jika koefisien korelasi negatif, ini berarti ada hubungan terbalik: semakin tinggi nilai satu variabel, semakin rendah nilai variabel lainnya.
Bergantung pada nilai koefisien r yang diterima, berbagai jenis korelasi dapat dibedakan:
Korelasi positif yang kuat ditentukan oleh nilai r=1. Istilah "ketat" berarti bahwa nilai satu variabel ditentukan secara unik oleh nilai variabel lain, dan istilah " positif" - bahwa ketika nilai satu variabel meningkat, nilai variabel lainnya juga meningkat.
Korelasi ketat adalah abstraksi matematis dan hampir tidak pernah terjadi dalam penelitian nyata.
korelasi positif sesuai dengan nilai 0
Kurangnya korelasi ditentukan oleh nilai r=0. Koefisien korelasi nol menunjukkan bahwa nilai variabel tidak terkait satu sama lain dengan cara apa pun.
Kurangnya korelasi H Hai : 0 r xy =0 dirumuskan sebagai refleksi batal hipotesis dalam analisis korelasi.
korelasi negatif: -1
Korelasi negatif yang kuat ditentukan oleh nilai r= -1. Itu, seperti korelasi positif yang ketat, adalah abstraksi dan tidak menemukan ekspresi dalam penelitian praktis.
Tabel 1
Jenis korelasi dan definisinya
Metode penghitungan koefisien korelasi bergantung pada jenis skala yang digunakan untuk mengukur nilai variabel.
Koefisien korelasi rPearson adalah yang utama dan dapat digunakan untuk variabel dengan skala interval nominal dan terurut sebagian, distribusi nilai yang sesuai dengan normal (korelasi momen produk). Koefisien korelasi Pearson juga memberikan hasil yang cukup akurat dalam kasus distribusi abnormal.
Untuk distribusi yang tidak normal, lebih disukai menggunakan koefisien korelasi peringkat Spearman dan Kendall. Mereka diberi peringkat karena program mempra-peringkat variabel yang berkorelasi.
Program SPSS menghitung korelasi r-Spearman sebagai berikut: pertama, variabel diubah menjadi peringkat, dan kemudian rumus Pearson diterapkan ke peringkat.
Korelasi yang dikemukakan oleh M. Kendall didasarkan pada gagasan bahwa arah hubungan dapat dinilai dengan membandingkan subjek secara berpasangan. Jika untuk sepasang subjek perubahan X bertepatan dengan arah perubahan Y bertepatan, maka ini menunjukkan hubungan positif. Jika tidak cocok, maka tentang hubungan negatif. Koefisien ini digunakan terutama oleh psikolog yang bekerja dengan sampel kecil. Karena sosiolog bekerja dengan susunan data yang besar, sulit untuk memilah-milah pasangan, mengidentifikasi perbedaan frekuensi relatif dan inversi dari semua pasangan subjek dalam sampel. Yang paling umum adalah koefisien. Pearson.
Karena koefisien korelasi rPearson adalah yang utama dan dapat digunakan (dengan beberapa kesalahan tergantung pada jenis skala dan tingkat ketidaknormalan dalam distribusi) untuk semua variabel yang diukur pada skala kuantitatif, kami akan mempertimbangkan contoh penggunaannya dan membandingkannya hasil yang diperoleh dengan hasil pengukuran menggunakan koefisien korelasi lainnya.
Rumus untuk menghitung koefisien r- Pearson:
r xy = ∑ (Xi-Xav)∙(Yi-Yav) / (N-1)∙σ x ∙σ y ∙
Dimana: Xi, Yi- Nilai dari dua variabel;
Xav, Yav - nilai rata-rata dari dua variabel;
σ x , σ y adalah standar deviasi,
N adalah jumlah pengamatan.
Korelasi pasangan
Misalnya, kami ingin mengetahui bagaimana jawaban antara berbagai jenis nilai tradisional berkorelasi dengan gagasan siswa tentang tempat kerja yang ideal (variabel: a9.1, a9.3, a9.5, a9.7) , lalu tentang rasio nilai liberal (a9 .2, a9.4, a9.6, a9.8). Variabel-variabel ini diukur pada skala terurut 5 term.
Kami menggunakan prosedur: "Analisis", "Korelasi", "Berpasangan". Secara default, koefisien Pearson diatur di kotak dialog. Kami menggunakan koefisien Pearson
Variabel yang diuji dipindahkan ke jendela pemilihan: a9.1, a9.3, a9.5, a9.7
Dengan menekan OK, kami mendapatkan perhitungan:
Korelasi
a9.1.t. Seberapa penting memiliki cukup waktu untuk keluarga dan kehidupan pribadi? |
Korelasi Pearson |
||||
Nilai (2 sisi) |
|||||
a9.3.t. Seberapa penting untuk tidak takut kehilangan pekerjaan? |
Korelasi Pearson |
||||
Nilai (2 sisi) |
|||||
a9.5.t. Seberapa penting memiliki atasan yang akan berkonsultasi dengan Anda saat membuat keputusan ini atau itu? |
Korelasi Pearson |
||||
Nilai (2 sisi) |
|||||
a9.7.t. Seberapa penting bekerja dalam tim yang terkoordinasi dengan baik, merasa menjadi bagian darinya? |
Korelasi Pearson |
||||
Nilai (2 sisi) |
|||||
** Korelasi signifikan pada level 0,01 (2 sisi).
Tabel nilai kuantitatif dari matriks korelasi yang dibangun
Korelasi parsial:
Pertama, mari kita buat korelasi berpasangan antara kedua variabel ini:
Korelasi |
|||
c8. Merasa dekat dengan mereka yang tinggal di dekat Anda, tetangga |
Korelasi Pearson |
||
Nilai (2 sisi) |
|||
c12. Merasa dekat dengan keluarga mereka |
Korelasi Pearson |
||
Nilai (2 sisi) |
|||
**. Korelasi signifikan pada tingkat 0,01 (2-sisi). |
Kemudian kami menggunakan prosedur untuk membuat korelasi parsial: "Analisis", "Korelasi", "Parsial".
Misalkan nilai "Penting untuk menentukan dan mengubah urutan pekerjaan Anda secara mandiri" dalam kaitannya dengan variabel yang ditunjukkan akan menjadi faktor penentu, di bawah pengaruh hubungan yang diidentifikasi sebelumnya akan hilang atau berubah menjadi tidak penting. .
Korelasi |
||||
Variabel yang dikecualikan |
c8. Merasa dekat dengan mereka yang tinggal di dekat Anda, tetangga |
c12. Merasa dekat dengan keluarga mereka |
||
c16. Merasa dekat dengan orang yang memiliki kekayaan yang sama dengan Anda |
c8. Merasa dekat dengan mereka yang tinggal di dekat Anda, tetangga |
Korelasi |
||
Signifikansi (2 sisi) |
||||
c12. Merasa dekat dengan keluarga mereka |
Korelasi |
|||
Signifikansi (2 sisi) |
||||
Seperti dapat dilihat dari tabel, di bawah pengaruh variabel kontrol, hubungannya sedikit menurun: dari 0,120 menjadi 0,102. itu tetap cukup tinggi dan memungkinkan seseorang untuk menyangkal hipotesis nol dengan kesalahan nol.
Koefisien korelasi
Cara paling akurat untuk menentukan kekencangan dan sifat korelasi adalah dengan mencari koefisien korelasi. Koefisien korelasi adalah angka yang ditentukan dengan rumus:
di mana r xy adalah koefisien korelasi;
x i -nilai fitur pertama;
i -nilai fitur kedua;
Rata-rata aritmatika dari nilai fitur pertama
Rata-rata aritmatika dari nilai fitur kedua
Untuk menggunakan rumus (32), kami membuat tabel yang akan memberikan urutan yang diperlukan dalam penyusunan angka untuk mencari pembilang dan penyebut dari koefisien korelasi.
Seperti yang dapat dilihat dari rumus (32), urutan tindakan adalah sebagai berikut: kami menemukan rata-rata aritmatika dari kedua tanda x dan y, kami menemukan perbedaan antara nilai tanda dan rata-ratanya (х i - ) dan y i - ), lalu kita cari hasilnya (х i - ) ( y i - ) – jumlah dari yang terakhir memberikan pembilang dari koefisien korelasi. Untuk menemukan penyebutnya, seseorang harus mengkuadratkan selisih (x i -) dan (y i -), mencari jumlahnya, dan mengekstrak akar kuadrat dari perkaliannya.
Jadi misalnya 31, mencari koefisien korelasi sesuai dengan rumus (32) dapat direpresentasikan sebagai berikut (Tabel 50).
Jumlah koefisien korelasi yang dihasilkan memungkinkan untuk menetapkan keberadaan, kedekatan, dan sifat hubungan.
1. Jika koefisien korelasinya nol, tidak ada hubungan antar fitur.
2. Jika koefisien korelasi sama dengan satu, maka hubungan antar fitur sangat besar sehingga berubah menjadi fungsional.
3. Nilai absolut dari koefisien korelasi tidak melampaui interval dari nol ke satu:
Ini memungkinkan untuk fokus pada kekencangan koneksi: semakin dekat koefisiennya ke nol, semakin lemah koneksinya, dan semakin dekat ke kesatuan, semakin dekat koneksinya.
4. Tanda koefisien korelasi "plus" berarti korelasi langsung, tanda "minus" berarti kebalikannya.
Meja 50
x saya | saya | (х saya - ) | (saya - ) | (x i - )(y i - ) | (х i - )2 | (y i - )2 |
14,00 | 12,10 | -1,70 | -2,30 | +3,91 | 2,89 | 5,29 |
14,20 | 13,80 | -1,50 | -0,60 | +0,90 | 2,25 | 0,36 |
14,90 | 14,20 | -0,80 | -0,20 | +0,16 | 0,64 | 0,04 |
15,40 | 13,00 | -0,30 | -1,40 | +0,42 | 0,09 | 1,96 |
16,00 | 14,60 | +0,30 | +0,20 | +0,06 | 0,09 | 0,04 |
17,20 | 15,90 | +1,50 | +2,25 | 2,25 | ||
18,10 | 17,40 | +2,40 | +2,00 | +4,80 | 5,76 | 4,00 |
109,80 | 101,00 | 12,50 | 13,97 | 13,94 |
Jadi, koefisien korelasi yang dihitung dalam Contoh 31 adalah r xy = +0,9. memungkinkan kita untuk menarik kesimpulan berikut: ada korelasi antara besarnya kekuatan otot tangan kanan dan kiri pada anak sekolah yang diteliti (koefisien r xy \u003d + 0,9 bukan nol), hubungannya sangat erat (koefisien r xy \u003d + 0,9 mendekati satu), korelasinya langsung (koefisien r xy = +0,9 adalah positif), yaitu dengan peningkatan kekuatan otot salah satu tangan, kekuatan tangan lainnya meningkat.
Saat menghitung koefisien korelasi dan menggunakan propertinya, harus diperhitungkan bahwa kesimpulan memberikan hasil yang benar ketika fitur didistribusikan secara normal dan ketika hubungan antara sejumlah besar nilai dari kedua fitur dipertimbangkan.
Dalam contoh 31 yang dipertimbangkan, hanya 7 nilai dari kedua fitur yang dianalisis, yang tentu saja tidak cukup untuk studi semacam itu. Kami ingatkan sekali lagi di sini bahwa contoh-contoh, dalam buku ini secara umum dan dalam bab ini khususnya, bersifat ilustrasi metode, dan bukan presentasi terperinci dari eksperimen ilmiah apa pun. Akibatnya, sejumlah kecil nilai fitur dipertimbangkan, pengukuran dibulatkan - semua ini dilakukan agar tidak mengaburkan gagasan metode dengan perhitungan yang rumit.
Perhatian khusus harus diberikan pada esensi hubungan yang sedang dipertimbangkan. Koefisien korelasi tidak dapat mengarah pada hasil penelitian yang benar jika analisis hubungan antar fitur dilakukan secara formal. Mari kembali ke contoh 31. Kedua tanda yang dimaksud adalah nilai kekuatan otot tangan kanan dan kiri. Bayangkan dengan fitur x i pada contoh 31 (14.0; 14.2; 14.9... ...18.1) yang kami maksud adalah panjang ikan yang ditangkap secara acak dalam sentimeter, dan dengan fitur y i (12.1 ; 13.8; 14.2 ... ... 17.4) - berat instrumen di laboratorium dalam kilogram. Secara formal, dengan menggunakan alat perhitungan untuk mencari koefisien korelasi dan dalam hal ini juga memperoleh r xy =+0>9, kita seharusnya menyimpulkan bahwa ada hubungan yang erat yang bersifat langsung antara panjang ikan dan berat ikan. instrumen. Absurditas dari kesimpulan seperti itu sudah jelas.
Untuk menghindari pendekatan formal dalam menggunakan koefisien korelasi, seseorang harus menggunakan metode lain - matematika, logis, eksperimental, teoretis - untuk mengidentifikasi kemungkinan korelasi antar tanda, yaitu untuk mendeteksi kesatuan organik tanda. Baru setelah itu seseorang dapat mulai menggunakan analisis korelasi dan menetapkan besarnya dan sifat hubungan tersebut.
Dalam statistik matematika, ada juga konsepnya korelasi berganda- Hubungan antara tiga fitur atau lebih. Dalam kasus ini, koefisien korelasi berganda digunakan, terdiri dari koefisien korelasi berpasangan yang dijelaskan di atas.
Misalnya, koefisien korelasi dari tiga tanda - x i , y i , z i - adalah:
di mana R xyz -koefisien korelasi berganda yang menyatakan bagaimana fitur xi bergantung pada fitur y i dan zi ;
r xy -koefisien korelasi antara fitur xi dan y i ;
r xz - koefisien korelasi antara fitur Xi dan Zi;
r yz - koefisien korelasi antara fitur y i , zi
Analisis korelasi adalah:
Analisis korelasiKorelasi- hubungan statistik dari dua atau lebih variabel acak (atau variabel yang dapat dianggap demikian dengan tingkat akurasi yang dapat diterima). Pada saat yang sama, perubahan dalam satu atau lebih kuantitas ini menyebabkan perubahan sistematis pada kuantitas lain atau lainnya. Koefisien korelasi berfungsi sebagai ukuran matematis dari korelasi dua variabel acak.
Korelasi bisa positif dan negatif (mungkin juga tidak ada hubungan statistik - misalnya, untuk variabel acak independen). korelasi negatif - korelasi, di mana peningkatan satu variabel dikaitkan dengan penurunan variabel lain, sedangkan koefisien korelasinya negatif. korelasi positif - korelasi di mana peningkatan satu variabel dikaitkan dengan peningkatan variabel lain, sedangkan koefisien korelasinya positif.
autokorelasi - hubungan statistik antara variabel acak dari deret yang sama, tetapi diambil dengan pergeseran, misalnya untuk proses acak - dengan pergeseran waktu.
Metode pengolahan data statistik yang terdiri dari mempelajari koefisien (korelasi) antar variabel disebut analisis korelasi.
Koefisien korelasi
Koefisien korelasi atau koefisien korelasi pasangan dalam teori probabilitas dan statistik, ini merupakan indikator sifat perubahan dua variabel acak. Koefisien korelasi dilambangkan dengan huruf Latin R dan dapat mengambil nilai antara -1 dan +1. Jika nilai modulo mendekati 1, maka ini berarti adanya koneksi yang kuat (dengan koefisien korelasi sama dengan satu, mereka berbicara tentang koneksi fungsional), dan jika mendekati 0, maka koneksi lemah.
Koefisien korelasi Pearson
Untuk kuantitas metrik, koefisien korelasi Pearson digunakan, rumus persisnya diperkenalkan oleh Francis Galton:
Membiarkan X,Y- dua variabel acak yang didefinisikan pada ruang probabilitas yang sama. Kemudian koefisien korelasinya diberikan dengan rumus:
,di mana cov adalah kovarians dan D adalah varians, atau ekuivalen,
,di mana simbol menunjukkan ekspektasi matematis.
Untuk menggambarkan hubungan seperti itu secara grafis, Anda dapat menggunakan sistem koordinat persegi panjang dengan sumbu yang sesuai dengan kedua variabel. Setiap pasangan nilai ditandai dengan simbol tertentu. Plot seperti ini disebut "scatterplot".
Metode penghitungan koefisien korelasi bergantung pada jenis skala yang dirujuk oleh variabel. Jadi, untuk mengukur variabel dengan skala interval dan kuantitatif, perlu menggunakan koefisien korelasi Pearson (korelasi product moment). Jika setidaknya satu dari dua variabel memiliki skala ordinal, atau tidak terdistribusi normal, korelasi peringkat Spearman atau τ (tau) Kendal harus digunakan. Dalam kasus ketika salah satu dari dua variabel dikotomis, korelasi titik dua seri digunakan, dan jika kedua variabel dikotomis, korelasi empat bidang digunakan. Perhitungan koefisien korelasi antara dua variabel non-dikotomis masuk akal hanya jika hubungan keduanya linier (searah).
Koefisien korelasi Kendell
Digunakan untuk mengukur gangguan timbal balik.
Koefisien korelasi Spearman
Sifat koefisien korelasi
- Cauchy - ketimpangan Bunyakovsky:
Analisis korelasi
Analisis korelasi- metode pemrosesan data statistik, yang terdiri dari mempelajari koefisien ( korelasi) antar variabel. Dalam hal ini, koefisien korelasi antara satu pasang atau beberapa pasang fitur dibandingkan untuk membangun hubungan statistik di antara mereka.
Target analisis korelasi- memberikan beberapa informasi tentang satu variabel dengan bantuan variabel lain. Dalam kasus di mana tujuan dapat dicapai, kami mengatakan bahwa variabel menghubungkan. Dalam bentuknya yang paling umum, adopsi hipotesis tentang adanya korelasi berarti bahwa perubahan nilai variabel A akan terjadi bersamaan dengan perubahan proporsional pada nilai B: jika kedua variabel meningkat, maka korelasinya positif jika satu variabel meningkat dan yang lainnya menurun, korelasi negatif.
Korelasi hanya mencerminkan ketergantungan linear dari kuantitas, tetapi tidak mencerminkan konektivitas fungsionalnya. Misalnya, jika kita menghitung koefisien korelasi antar nilai SEBUAH = ssayan(x) dan B = cHais(x), maka akan mendekati nol, yaitu tidak ada ketergantungan antara kuantitas. Sementara itu, besaran A dan B jelas berhubungan secara fungsional menurut hukum ssayan 2(x) + cHais 2(x) = 1.
Keterbatasan analisis korelasi
Plot distribusi pasangan (x,y) dengan koefisien korelasi x dan y yang sesuai untuk masing-masingnya. Perhatikan bahwa koefisien korelasi mencerminkan hubungan linier (baris atas), tetapi tidak menggambarkan kurva hubungan (baris tengah), dan sama sekali tidak cocok untuk menggambarkan hubungan non-linear yang kompleks (baris bawah).
- Penerapan dimungkinkan jika ada cukup banyak kasus untuk dipelajari: untuk jenis koefisien korelasi tertentu, berkisar antara 25 hingga 100 pasang pengamatan.
- Keterbatasan kedua mengikuti dari hipotesis analisis korelasi, yang meliputi ketergantungan linier variabel. Dalam banyak kasus, ketika diketahui secara andal bahwa ada ketergantungan, analisis korelasi mungkin tidak memberikan hasil hanya karena ketergantungannya tidak linier (dinyatakan, misalnya, sebagai parabola).
- Dengan sendirinya, fakta korelasi tidak memberikan alasan untuk menyatakan variabel mana yang mendahului atau menyebabkan perubahan, atau bahwa variabel tersebut umumnya terkait satu sama lain secara kausal, misalnya, karena tindakan faktor ketiga.
Area aplikasi
Metode pemrosesan data statistik ini sangat populer di bidang ekonomi dan ilmu sosial (khususnya, dalam psikologi dan sosiologi), meskipun ruang lingkup penerapan koefisien korelasi sangat luas: kontrol kualitas produk industri, metalurgi, kimia pertanian, hidrobiologi, biometrik, dan lain-lain.
Popularitas metode ini disebabkan oleh dua hal: koefisien korelasi relatif mudah dihitung, penerapannya tidak memerlukan pelatihan matematika khusus. Dikombinasikan dengan kemudahan interpretasi, kemudahan penerapan koefisien telah menyebabkan penggunaannya secara luas di bidang analisis data statistik.
korelasi palsu
Kesederhanaan studi korelasi yang sering menggoda mendorong peneliti untuk menarik kesimpulan intuitif yang salah tentang adanya hubungan sebab akibat antara pasangan sifat, sedangkan koefisien korelasi hanya membangun hubungan statistik.
Dalam metodologi kuantitatif ilmu-ilmu sosial modern, pada kenyataannya, upaya untuk menetapkan hubungan sebab akibat antara variabel yang diamati dengan metode empiris telah ditinggalkan. Oleh karena itu, ketika para peneliti ilmu sosial berbicara tentang membangun hubungan antara variabel yang mereka pelajari, baik asumsi teoretis umum atau ketergantungan statistik tersirat.
Lihat juga
- Fungsi autokorelasi
- Fungsi korelasi silang
- kovarians
- Koefisien determinasi
- Analisis regresi
Yayasan Wikimedia. 2010.
Berbagai fitur mungkin terkait.
Ada 2 jenis koneksi di antara mereka:
- fungsional;
- korelasi.
Korelasi diterjemahkan ke dalam bahasa Rusia - tidak lebih dari sebuah koneksi.
Dalam kasus korelasi, ada korespondensi beberapa nilai dari satu atribut ke beberapa nilai atribut lainnya. Sebagai contoh, kita dapat mempertimbangkan korelasi yang ditetapkan antara:
- panjang cakar, leher, paruh pada burung seperti bangau, bangau, bangau;
- indikator suhu tubuh dan detak jantung.
Untuk sebagian besar proses biomedis, keberadaan jenis koneksi ini telah terbukti secara statistik.
Metode statistik memungkinkan untuk menetapkan fakta keberadaan saling ketergantungan fitur. Penggunaan perhitungan khusus untuk ini mengarah pada pembentukan koefisien korelasi (ukuran konektivitas).
Perhitungan seperti itu disebut analisis korelasi. Hal ini dilakukan untuk mengkonfirmasi ketergantungan 2 variabel (variabel acak) satu sama lain, yang dinyatakan dengan koefisien korelasi.
Menggunakan metode korelasi memungkinkan kita untuk memecahkan beberapa masalah:
- mengidentifikasi hubungan antara parameter yang dianalisis;
- pengetahuan tentang adanya korelasi memungkinkan pemecahan masalah peramalan. Dengan demikian, ada kemungkinan nyata untuk memprediksi perilaku suatu parameter berdasarkan analisis perilaku parameter lain yang berkorelasi;
- klasifikasi berdasarkan pemilihan fitur independen satu sama lain.
Untuk variabel:
- terkait dengan skala ordinal, koefisien Spearman dihitung;
- terkait dengan skala interval - koefisien Pearson.
Ini adalah parameter yang paling umum digunakan, tetapi ada yang lain.
Nilai koefisien dapat dinyatakan positif dan negatif.
Dalam kasus pertama, dengan peningkatan nilai satu variabel, peningkatan yang kedua diamati. Dengan koefisien negatif, polanya terbalik.
Untuk apa koefisien korelasinya?
Variabel acak yang terhubung satu sama lain dapat memiliki sifat yang sama sekali berbeda dari koneksi ini. Itu belum tentu fungsional, kasus ketika ada hubungan langsung antara kuantitas. Paling sering, kedua kuantitas dipengaruhi oleh serangkaian faktor yang berbeda, dalam kasus di mana keduanya sama untuk kedua kuantitas, pembentukan pola terkait diamati.
Artinya, fakta yang terbukti secara statistik tentang adanya hubungan antara kuantitas bukanlah konfirmasi bahwa penyebab perubahan yang diamati telah ditetapkan. Sebagai aturan, peneliti menyimpulkan bahwa ada dua konsekuensi yang saling terkait.
Sifat koefisien korelasi
Statistik ini memiliki sifat-sifat berikut:
- nilai koefisien berkisar dari -1 hingga +1. Semakin mendekati nilai ekstrim, semakin kuat hubungan positif atau negatif antara parameter linier. Dalam kasus nilai nol, kita berbicara tentang tidak adanya korelasi antar fitur;
- nilai koefisien yang positif menunjukkan bahwa dalam kasus peningkatan nilai satu atribut, peningkatan yang kedua diamati (korelasi positif);
- nilai negatif - dalam kasus peningkatan nilai satu atribut, penurunan yang kedua diamati (korelasi negatif);
- mendekati nilai indikator ke titik ekstrim (baik -1 atau +1) menunjukkan adanya hubungan linier yang sangat kuat;
- indikator sifat dapat berubah dengan nilai koefisien yang konstan;
- koefisien korelasi adalah kuantitas tak berdimensi;
- adanya korelasi bukanlah konfirmasi wajib dari hubungan sebab akibat.
Nilai koefisien korelasi
Kekuatan korelasi dapat dicirikan dengan menggunakan skala Cheldok, di mana karakteristik kualitatif sesuai dengan nilai numerik tertentu.
Dalam kasus korelasi positif pada nilai:
- 0-0,3 - korelasi sangat lemah;
- 0,3-0,5 - lemah;
- 0,5-0,7 - kekuatan sedang;
- 0,7-0,9 - tinggi;
- 0,9-1 - kekuatan korelasi yang sangat tinggi.
Skala juga dapat digunakan untuk korelasi negatif. Dalam hal ini, karakteristik kualitatif diganti dengan yang berlawanan.
Anda dapat menggunakan skala Cheldok yang disederhanakan, di mana hanya 3 gradasi kekuatan korelasi yang dibedakan:
- sangat kuat - indikator ± 0,7 - ± 1;
- rata-rata - indikator ± 0,3 - ± 0,699;
- sangat lemah - indikator 0 - ± 0,299.
Indikator statistik ini memungkinkan tidak hanya untuk menguji asumsi adanya hubungan linier antara fitur-fitur, tetapi juga untuk menetapkan kekuatannya.
Jenis koefisien korelasi
Koefisien korelasi dapat diklasifikasikan berdasarkan tanda dan nilai:
- positif;
- batal;
- negatif.
Bergantung pada nilai yang dianalisis, koefisien dihitung:
- Pearson;
- Pendekar tombak;
- Kendala;
- Tanda-tanda Fechner;
- konkordansi atau korelasi peringkat berganda.
Koefisien korelasi Pearson digunakan untuk menetapkan hubungan langsung antara nilai absolut variabel. Dalam hal ini, distribusi kedua rangkaian variabel harus mendekati normal. Variabel yang dibandingkan harus berbeda dengan jumlah fitur yang berbeda-beda. Skala yang mewakili variabel harus berupa skala interval atau skala rasio.
- pembentukan kekuatan korelasi yang tepat;
- perbandingan karakteristik kuantitatif.
Ada beberapa kerugian menggunakan koefisien korelasi linier Pearson:
- metode ini tidak stabil jika terdapat outlier nilai numerik;
- dengan menggunakan metode ini, adalah mungkin untuk menentukan kekuatan korelasi hanya untuk hubungan linier, untuk jenis hubungan timbal balik variabel lainnya, metode analisis regresi harus digunakan.
Korelasi peringkat ditentukan oleh metode Spearman, yang memungkinkan untuk mempelajari hubungan antar fenomena secara statistik. Berkat koefisien ini, tingkat paralelisme sebenarnya dari dua rangkaian fitur yang diekspresikan secara kuantitatif dihitung, dan kedekatan hubungan yang teridentifikasi juga diperkirakan.
- tidak membutuhkan definisi yang tepat dari nilai kekuatan korelasi;
- indikator yang dibandingkan memiliki nilai kuantitatif dan atributif;
- perbandingan deretan fitur dengan varian nilai terbuka.
Metode Spearman mengacu pada metode analisis non-parametrik, sehingga tidak perlu memeriksa kenormalan distribusi fitur. Selain itu, ini memungkinkan Anda untuk membandingkan indikator yang dinyatakan dalam skala yang berbeda. Misalnya membandingkan nilai jumlah sel darah merah dalam volume darah tertentu (skala kontinyu) dan penilaian ahli, dinyatakan dalam poin (skala ordinal).
Efisiensi metode dipengaruhi secara negatif oleh perbedaan besar antara nilai dari nilai yang dibandingkan. Metode ini juga tidak efektif jika nilai terukur dicirikan oleh distribusi nilai yang tidak merata.
Langkah demi langkah perhitungan koefisien korelasi di Excel
Perhitungan koefisien korelasi melibatkan eksekusi berurutan dari sejumlah operasi matematika.
Rumus untuk menghitung koefisien Pearson di atas menunjukkan betapa sulitnya proses ini jika dilakukan secara manual.
Menggunakan kemampuan Excell terkadang mempercepat proses menemukan koefisien.
Cukup mengikuti algoritme tindakan sederhana:
- pengenalan informasi dasar - kolom nilai x dan kolom nilai y;
- di alat, tab Rumus dipilih dan dibuka;
- di tab yang terbuka, pilih "Sisipkan fungsi fx";
- di kotak dialog yang terbuka, fungsi statistik "Correl" dipilih, yang memungkinkan Anda menghitung koefisien korelasi antara 2 larik data;
- data dimasukkan di jendela yang terbuka: larik 1 - rentang nilai kolom x (data harus dipilih), larik 2 - rentang nilai kolom y;
- tombol "OK" ditekan, hasil penghitungan koefisien muncul di baris "nilai";
- kesimpulan mengenai adanya korelasi antara 2 set data dan kekuatannya.
Model korelasi (CM) adalah program perhitungan yang menyediakan persamaan matematis di mana indikator yang dihasilkan dikuantifikasi tergantung pada satu atau lebih indikator.
yx \u003d ao + a1x1
dimana: y - indikator kinerja, tergantung pada faktor x;
x - tanda faktor;
a1 - parameter KM, menunjukkan seberapa besar indikator efektif y akan berubah ketika faktor x berubah sebesar satu, jika pada saat yang sama semua faktor lain yang mempengaruhi y tetap tidak berubah;
ao - parameter KM, yang menunjukkan pengaruh semua faktor lain pada indikator efektif y, kecuali tanda faktor x
Saat memilih indikator efektif dan faktor dari model, perlu diperhatikan fakta bahwa indikator efektif dalam rantai hubungan sebab-akibat berada pada level yang lebih tinggi daripada indikator faktor.
Karakteristik model korelasi
Setelah menghitung parameter model korelasi, maka dihitung koefisien korelasinya.
koefisien korelasi p - pair, -1 ≤ p ≤ 1, menunjukkan kekuatan dan arah pengaruh indikator faktor terhadap efektif. Semakin dekat dengan 1, semakin kuat hubungannya, semakin dekat dengan 0, semakin lemah hubungannya. Jika koefisien korelasinya positif, maka hubungannya searah, jika negatif, maka berbanding terbalik.
Rumus koefisien korelasi: pxy \u003d (xy-x * 1 / y) / eh * ey
ex=xx2-(x)2 ; eu=y2-(y)2
Jika CM adalah linier multifaktorial, berbentuk:
yx \u003d ao + a1x1 + a2x2 + ... + axp
kemudian koefisien korelasi berganda dihitung untuk itu.
0 ≤ Р ≤ 1 dan menunjukkan kekuatan pengaruh semua indikator faktor secara bersama-sama terhadap yang efektif.
P \u003d 1- ((uh-uy) 2 / (yi - usr) 2)
Dimana: uh - indikator efektif - nilai yang dihitung;
ui - nilai sebenarnya;
usr - nilai sebenarnya, rata-rata.
Nilai hitung yx diperoleh sebagai hasil substitusi ke dalam model korelasi, bukan x1, x2, dst. nilai aktual mereka.
Untuk model nonlinier faktor tunggal dan multifaktor, rasio korelasi dihitung:
1 ≤ m ≤ 1;
Dipercayai bahwa hubungan antara indikator efektif dan faktor yang dimasukkan dalam model lemah jika nilai koefisien kedekatan hubungan (m) berada dalam kisaran 0-0,3; jika 0,3-0,7 - kekencangan koneksi rata-rata; di atas 0,7-1 - koneksi kuat.
Karena koefisien korelasi (berpasangan) p, koefisien korelasi (berganda) P, rasio korelasi m adalah nilai probabilistik, maka koefisien signifikansinya dihitung untuknya (ditentukan dari tabel). Jika koefisien ini lebih besar dari nilai tabularnya, maka koefisien kedekatan hubungan adalah alasan yang signifikan. Jika koefisien signifikansi kekencangan koneksi kurang dari nilai tabel, atau jika koefisien koneksi itu sendiri kurang dari 0,7, maka tidak semua indikator faktor yang secara signifikan mempengaruhi hasil dimasukkan ke dalam model.
Koefisien determinasi dengan jelas menunjukkan persentase indikator faktor yang termasuk dalam model yang menentukan pembentukan hasil.
Jika koefisien determinasi lebih besar dari 50, maka model tersebut cukup menggambarkan proses yang diteliti, jika kurang dari 50, maka perlu kembali ke tahap pertama konstruksi dan merevisi pemilihan indikator faktor untuk dimasukkan ke dalam model.
Koefisien Fisher atau kriteria Fisher mencirikan keefektifan model secara keseluruhan. Jika nilai koefisien yang dihitung melebihi nilai tabel, maka model yang dibangun cocok untuk analisis, serta indikator perencanaan, perhitungan untuk masa depan. Perkiraan nilai tabel \u003d 1,5. Jika nilai hitung lebih kecil dari nilai tabel, maka perlu dibangun model terlebih dahulu dengan menyertakan faktor-faktor yang berpengaruh signifikan terhadap hasil. Selain efektivitas model secara keseluruhan, masing-masing koefisien regresi berpengaruh terhadap materialitas. Jika nilai yang dihitung dari koefisien ini melebihi nilai tabel, maka koefisien regresi akan menjadi signifikan, jika kurang, maka indikator faktor yang menghitung koefisien ini dikeluarkan dari sampel, perhitungan akan dimulai kembali, tetapi tanpa faktor ini .
Koefisien korelasi adalah tingkat hubungan antara dua variabel. Perhitungannya memberikan gambaran apakah ada hubungan antara dua kumpulan data. Tidak seperti regresi, korelasi tidak memungkinkan untuk memprediksi nilai. Namun, perhitungan koefisien merupakan langkah penting dalam analisis statistik pendahuluan. Misalnya, kami menemukan bahwa koefisien korelasi antara tingkat investasi asing langsung dan pertumbuhan PDB adalah tinggi. Ini memberi kita gambaran bahwa untuk memastikan kemakmuran, perlu diciptakan iklim yang kondusif khusus untuk pengusaha asing. Kesimpulan yang tidak begitu jelas pada pandangan pertama!
Korelasi dan sebab-akibat
Mungkin tidak ada satu pun area statistik yang akan mapan dalam hidup kita. Koefisien korelasi digunakan di semua bidang pengetahuan publik. Bahaya utamanya terletak pada kenyataan bahwa nilai-nilainya yang tinggi seringkali dispekulasikan untuk meyakinkan orang dan membuat mereka percaya pada beberapa kesimpulan. Namun, pada kenyataannya, korelasi yang kuat sama sekali tidak menunjukkan hubungan sebab akibat antara kuantitas.
Koefisien korelasi: Rumus Pearson dan Spearman
Ada beberapa indikator utama yang mencirikan hubungan antara dua variabel. Secara historis, yang pertama adalah koefisien korelasi linier Pearson. Itu diwariskan di sekolah. Ini dikembangkan oleh K. Pearson dan J. Yule berdasarkan karya Fr. Galton. Koefisien ini memungkinkan Anda untuk melihat hubungan antara bilangan rasional yang berubah secara rasional. Itu selalu lebih besar dari -1 dan kurang dari 1. Angka negatif menunjukkan hubungan berbanding terbalik. Jika koefisiennya nol, maka tidak ada hubungan antar variabel. Sama dengan angka positif - ada hubungan proporsional langsung antara kuantitas yang dipelajari. Koefisien korelasi peringkat Spearman memungkinkan untuk menyederhanakan perhitungan dengan menyusun hierarki nilai variabel.
Hubungan antar variabel
Korelasi membantu menjawab dua pertanyaan. Pertama, apakah hubungan antar variabel itu positif atau negatif. Kedua, seberapa kuat kecanduan itu. Analisis korelasi adalah alat yang ampuh untuk mendapatkan informasi penting ini. Sangat mudah untuk melihat bahwa pendapatan dan pengeluaran rumah tangga naik dan turun secara proporsional. Hubungan seperti itu dianggap positif. Sebaliknya, ketika harga suatu produk naik, permintaannya turun. Hubungan seperti itu disebut negatif. Nilai koefisien korelasi antara -1 dan 1. Nol berarti tidak ada hubungan antara nilai yang dipelajari. Semakin dekat indikator dengan nilai ekstrem, semakin kuat hubungannya (negatif atau positif). Tidak adanya ketergantungan dibuktikan dengan koefisien dari -0,1 hingga 0,1. Harus dipahami bahwa nilai seperti itu hanya menunjukkan tidak adanya hubungan linier.
Fitur aplikasi
Penggunaan kedua indikator tunduk pada asumsi tertentu. Pertama, adanya hubungan yang kuat tidak menentukan fakta bahwa satu nilai menentukan nilai lainnya. Mungkin ada kuantitas ketiga yang mendefinisikan masing-masing. Kedua, koefisien korelasi Pearson yang tinggi tidak menunjukkan hubungan sebab akibat antara variabel yang diteliti. Ketiga, ini menunjukkan hubungan linier yang eksklusif. Korelasi dapat digunakan untuk mengevaluasi data kuantitatif yang bermakna (misalnya tekanan barometrik, suhu udara) daripada kategori seperti jenis kelamin atau warna favorit.
Koefisien korelasi berganda
Pearson dan Spearman menyelidiki hubungan antara dua variabel. Tapi apa yang harus dilakukan jika jumlahnya tiga atau bahkan lebih. Di sinilah koefisien korelasi berganda masuk. Misalnya, produk nasional bruto tidak hanya dipengaruhi oleh investasi asing langsung, tetapi juga oleh kebijakan moneter dan fiskal negara, serta tingkat ekspor. Laju pertumbuhan dan volume PDB merupakan hasil interaksi sejumlah faktor. Namun, perlu dipahami bahwa model korelasi berganda didasarkan pada sejumlah penyederhanaan dan asumsi. Pertama, multikolinieritas antar kuantitas dikecualikan. Kedua, hubungan antara variabel dependen dengan variabel yang mempengaruhinya diasumsikan linier.
Area penggunaan analisis korelasi dan regresi
Metode menemukan hubungan antara kuantitas ini banyak digunakan dalam statistik. Ini paling sering digunakan dalam tiga kasus utama:
- Untuk pengujian hubungan sebab akibat antara nilai dua variabel. Akibatnya, peneliti berharap menemukan hubungan linier dan mendapatkan rumus yang menggambarkan hubungan antara kuantitas ini. Satuan pengukuran mereka mungkin berbeda.
- Untuk memeriksa hubungan antara nilai-nilai. Dalam hal ini, tidak ada yang menentukan variabel mana yang bergantung. Ternyata nilai kedua kuantitas menentukan beberapa faktor lain.
- Untuk menurunkan persamaan. Dalam hal ini, Anda cukup mengganti angka ke dalamnya dan mencari tahu nilai variabel yang tidak diketahui.
Seorang pria yang mencari hubungan sebab akibat
Kesadaran diatur sedemikian rupa sehingga kita pasti perlu menjelaskan peristiwa yang terjadi di sekitar. Seseorang selalu mencari hubungan antara gambaran dunia tempat tinggalnya dan informasi yang diterimanya. Seringkali otak menciptakan keteraturan dari kekacauan. Dia dapat dengan mudah melihat hubungan sebab akibat di mana tidak ada. Ilmuwan harus belajar secara khusus untuk mengatasi tren ini. Kemampuan untuk mengevaluasi hubungan antara data secara objektif penting dalam karir akademik.
Bias media
Pertimbangkan bagaimana keberadaan korelasi dapat disalahartikan. Sekelompok siswa Inggris yang berperilaku buruk ditanya apakah orang tua mereka merokok. Kemudian tes tersebut dipublikasikan di koran. Hasil penelitian menunjukkan adanya korelasi yang kuat antara kebiasaan merokok orang tua dengan kenakalan anaknya. Profesor yang melakukan penelitian ini bahkan menyarankan untuk memberi peringatan tentang hal ini pada bungkus rokok. Namun, ada sejumlah masalah dengan kesimpulan ini. Pertama, korelasi tidak menunjukkan kuantitas mana yang independen. Oleh karena itu, sangat mungkin untuk berasumsi bahwa kebiasaan buruk orang tua disebabkan oleh ketidaktaatan anak. Kedua, tidak mungkin untuk mengatakan dengan pasti bahwa kedua masalah tersebut tidak muncul karena faktor ketiga. Misalnya, keluarga berpenghasilan rendah. Perlu diperhatikan aspek emosional dari kesimpulan awal profesor yang melakukan penelitian tersebut. Dia adalah penentang merokok yang gigih. Oleh karena itu, tidak mengherankan jika hasil penelitiannya diinterpretasikan demikian.
kesimpulan
Salah mengartikan korelasi sebagai hubungan sebab akibat antara dua variabel dapat menyebabkan kesalahan penelitian yang memalukan. Masalahnya terletak pada inti kesadaran manusia. Banyak trik pemasaran didasarkan pada fitur ini. Memahami perbedaan antara sebab akibat dan korelasi memungkinkan Anda menganalisis informasi secara rasional baik dalam kehidupan sehari-hari maupun dalam karier profesional Anda.