สหสัมพันธ์ในสถิติคืออะไร ค่าสัมประสิทธิ์สหสัมพันธ์เป็นลักษณะของแบบจำลองสหสัมพันธ์ วิธีตีความค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน
» สถิติ
สถิติและการประมวลผลข้อมูลทางจิตวิทยา
(ต่อเนื่อง)
การวิเคราะห์ความสัมพันธ์
เมื่อเรียน ความสัมพันธ์พยายามระบุว่ามีความสัมพันธ์ใดๆ ระหว่างตัวบ่งชี้สองตัวในกลุ่มตัวอย่างเดียวกันหรือไม่ (เช่น ระหว่างส่วนสูงและน้ำหนักของเด็ก หรือระหว่างระดับ ไอคิวและผลการเรียน) หรือระหว่างสองตัวอย่างที่แตกต่างกัน (เช่น เมื่อเปรียบเทียบฝาแฝดคู่หนึ่ง) และหากมีความสัมพันธ์นี้อยู่ ไม่ว่าการเพิ่มขึ้นของตัวบ่งชี้หนึ่งจะมาพร้อมกับการเพิ่มขึ้น (ความสัมพันธ์เชิงบวก) หรือการลดลง (ความสัมพันธ์เชิงลบ) ของ อื่นๆ.
กล่าวอีกนัยหนึ่ง การวิเคราะห์สหสัมพันธ์ช่วยในการกำหนดว่าเป็นไปได้หรือไม่ที่จะทำนายค่าที่เป็นไปได้ของตัวบ่งชี้หนึ่ง โดยรู้ถึงค่าของอีกตัวบ่งชี้หนึ่ง
จนถึงขณะนี้ เมื่อวิเคราะห์ผลลัพธ์จากประสบการณ์ของเราในการศึกษาผลกระทบของกัญชา เราจงใจเพิกเฉยต่อตัวบ่งชี้เช่นเวลาตอบสนอง ในขณะเดียวกัน มันเป็นเรื่องที่น่าสนใจที่จะตรวจสอบว่ามีความสัมพันธ์ระหว่างประสิทธิภาพของปฏิกิริยากับความเร็วของมันหรือไม่ สิ่งนี้จะช่วยให้สามารถโต้แย้งได้ว่ายิ่งบุคคลนั้นช้าเท่าไร การกระทำของเขาก็จะแม่นยำและมีประสิทธิภาพมากขึ้นเท่านั้น และในทางกลับกัน
เพื่อจุดประสงค์นี้ สามารถใช้วิธีการที่แตกต่างกันสองวิธี: วิธีพาราเมตริกในการคำนวณค่าสัมประสิทธิ์ Bravais-Pearson (r) และการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์อันดับ Spearman (r s) ซึ่งใช้กับข้อมูลลำดับ เช่น เป็นแบบไม่มีพาราเมตริก อย่างไรก็ตาม ก่อนอื่นเรามาทำความเข้าใจว่าค่าสัมประสิทธิ์สหสัมพันธ์คืออะไร
ค่าสัมประสิทธิ์สหสัมพันธ์
ค่าสัมประสิทธิ์สหสัมพันธ์คือค่าที่สามารถเปลี่ยนแปลงได้ตั้งแต่ +1 ถึง -1 ในกรณีของความสัมพันธ์เชิงบวกโดยสมบูรณ์ ค่าสัมประสิทธิ์นี้จะเท่ากับบวก 1 และในกรณีของความสัมพันธ์เชิงลบทั้งหมด ค่าสัมประสิทธิ์นี้จะเท่ากับลบ 1 บนกราฟ ค่านี้สอดคล้องกับเส้นตรงที่ผ่านจุดตัดของ ค่าของแต่ละคู่ข้อมูล:
หากจุดเหล่านี้ไม่เรียงตัวเป็นเส้นตรง แต่ก่อตัวเป็น "เมฆ" ค่าสัมบูรณ์ของสัมประสิทธิ์สหสัมพันธ์จะน้อยกว่าหนึ่งและเข้าใกล้ศูนย์เมื่อเมฆปัดเศษออก:
ถ้าสัมประสิทธิ์สหสัมพันธ์เป็น 0 ตัวแปรทั้งสองจะเป็นอิสระจากกันโดยสิ้นเชิง
ในมนุษยศาสตร์ ความสัมพันธ์ถือว่าแข็งแกร่งถ้าค่าสัมประสิทธิ์มากกว่า 0.60; หากเกิน 0.90 แสดงว่าความสัมพันธ์นั้นแข็งแกร่งมาก อย่างไรก็ตาม เพื่อให้สามารถสรุปผลเกี่ยวกับความสัมพันธ์ระหว่างตัวแปรต่างๆ ได้ ขนาดของกลุ่มตัวอย่างมีความสำคัญยิ่ง: ยิ่งกลุ่มตัวอย่างมีขนาดใหญ่ ค่าสัมประสิทธิ์สหสัมพันธ์ที่ได้รับก็จะยิ่งน่าเชื่อถือมากขึ้นเท่านั้น มีตารางที่มีค่าวิกฤตของค่าสัมประสิทธิ์สหสัมพันธ์ของ Bravais-Pearson และ Spearman สำหรับจำนวนองศาอิสระที่แตกต่างกัน (เท่ากับจำนวนคู่ลบ 2 เช่น n- 2). เฉพาะในกรณีที่ค่าสัมประสิทธิ์สหสัมพันธ์มากกว่าค่าวิกฤตเหล่านี้เท่านั้นจึงจะถือว่าเชื่อถือได้ ดังนั้นเพื่อให้ค่าสัมประสิทธิ์สหสัมพันธ์ 0.70 มีความน่าเชื่อถือ ควรนำข้อมูลอย่างน้อย 8 คู่มาวิเคราะห์ (ชม. =น-2=6) เมื่อคำนวณ r (ดูตารางที่ 4 ในภาคผนวก) และข้อมูล 7 คู่ (h = n-2= 5) เมื่อคำนวณ r s (ตารางที่ 5 ในภาคผนวก)
ฉันต้องการเน้นอีกครั้งว่าสาระสำคัญของค่าสัมประสิทธิ์ทั้งสองนี้แตกต่างกันบ้าง ค่าสัมประสิทธิ์เชิงลบ r บ่งชี้ว่าประสิทธิภาพมักจะยิ่งสูง ยิ่งเวลาตอบสนองเร็วขึ้น ในขณะที่เมื่อคำนวณค่าสัมประสิทธิ์ r s จำเป็นต้องตรวจสอบว่าวัตถุที่เร็วกว่ามักตอบสนองได้แม่นยำกว่าเสมอหรือไม่ และวัตถุที่ช้ากว่าจะมีความแม่นยำน้อยกว่า
ค่าสัมประสิทธิ์สหสัมพันธ์ของบราเวส์-เพียร์สัน (r) - นี่คือตัวบ่งชี้พารามิเตอร์สำหรับการคำนวณซึ่งเปรียบเทียบค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานของผลลัพธ์ของการวัดสองครั้ง ในกรณีนี้ จะใช้สูตร (สูตรอาจดูแตกต่างกันสำหรับผู้แต่งที่แตกต่างกัน)
ที่ไหน Σ XY-ผลรวมของผลคูณของข้อมูลจากแต่ละคู่
n คือจำนวนคู่
X - ค่าเฉลี่ยสำหรับตัวแปรที่กำหนด x;
วาย -
ค่าเฉลี่ยสำหรับข้อมูลตัวแปร วาย
Sx-ส่วนเบี่ยงเบนมาตรฐานสำหรับการแจกแจง X;
Sy-ส่วนเบี่ยงเบนมาตรฐานสำหรับการแจกแจง ที่
ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสเปียร์แมน (อาร์เอส ) - นี่คือตัวบ่งชี้ที่ไม่ใช่พารามิเตอร์ซึ่งพวกเขาพยายามเปิดเผยความสัมพันธ์ระหว่างอันดับของปริมาณที่สอดคล้องกันในการวัดสองชุด
ค่าสัมประสิทธิ์นี้คำนวณได้ง่ายกว่า แต่ผลลัพธ์มีความแม่นยำน้อยกว่าการใช้ r นี่คือความจริงที่ว่าเมื่อคำนวณค่าสัมประสิทธิ์ Spearman จะใช้ลำดับของข้อมูลไม่ใช่ลักษณะเชิงปริมาณและช่วงเวลาระหว่างคลาส
ความจริงก็คือเมื่อใช้ค่าสัมประสิทธิ์สหสัมพันธ์ของอันดับสเปียร์แมน (r s) พวกเขาจะตรวจสอบเฉพาะว่าอันดับของข้อมูลสำหรับตัวอย่างใด ๆ จะเหมือนกับในชุดข้อมูลอื่น ๆ สำหรับตัวอย่างนี้หรือไม่ ซึ่งเกี่ยวข้องกับคู่แรก (เช่น ว่าจะเหมือนกัน "จัดอันดับ" โดยนักเรียนทั้งด้านจิตวิทยาและคณิตศาสตร์ หรือแม้แต่กับครูจิตวิทยาสองคนที่แตกต่างกันหรือไม่) หากค่าสัมประสิทธิ์ใกล้เคียงกับ +1 แสดงว่าทั้งสองอนุกรมตรงกัน และถ้าค่าสัมประสิทธิ์นี้ใกล้เคียงกับ -1 เราสามารถพูดถึงความสัมพันธ์ผกผันได้อย่างสมบูรณ์
ค่าสัมประสิทธิ์ อาร์เอสคำนวณตามสูตร
ที่ไหน งคือความแตกต่างระหว่างอันดับของค่าคุณลักษณะคอนจูเกต (โดยไม่คำนึงถึงเครื่องหมาย) และคือจำนวนคู่
โดยปกติแล้ว การทดสอบแบบไม่มีพารามิเตอร์นี้จะใช้ในกรณีที่คุณต้องการข้อสรุปที่ไม่เกี่ยวกับเรื่องนี้มากนัก ช่วงเวลาระหว่างข้อมูลเท่าไหร่เกี่ยวกับพวกเขา อันดับและเมื่อเส้นโค้งการกระจายเอียงเกินไปและไม่อนุญาตให้ใช้เกณฑ์พาราเมตริก เช่น ค่าสัมประสิทธิ์ r (ในกรณีเหล่านี้ อาจจำเป็นต้องเปลี่ยนข้อมูลเชิงปริมาณเป็นข้อมูลลำดับ)
สรุป
ดังนั้นเราจึงได้พิจารณาวิธีการทางสถิติแบบพาราเมตริกและแบบไม่ใช้พาราเมตริกต่างๆ ที่ใช้ในทางจิตวิทยา การตรวจทานของเรานั้นผิวเผินมาก และงานหลักคือการทำให้ผู้อ่านเข้าใจว่าสถิติไม่ได้น่ากลัวอย่างที่คิด และต้องใช้สามัญสำนึกเป็นส่วนใหญ่ เราขอเตือนคุณว่าข้อมูลของ "ประสบการณ์" ที่เราจัดการในที่นี้เป็นเรื่องสมมติและไม่สามารถใช้เป็นพื้นฐานสำหรับข้อสรุปใดๆ อย่างไรก็ตาม การทดลองดังกล่าวก็คุ้มค่าที่จะทำ เนื่องจากการทดลองนี้เลือกใช้เทคนิคดั้งเดิมล้วนๆ จึงสามารถใช้การวิเคราะห์ทางสถิติแบบเดียวกันในการทดลองต่างๆ ได้ ไม่ว่าในกรณีใด ดูเหมือนว่าเราได้สรุปแนวทางหลักบางประการที่อาจเป็นประโยชน์สำหรับผู้ที่ไม่ทราบว่าจะเริ่มต้นการวิเคราะห์ทางสถิติของผลลัพธ์ได้จากที่ใด
วรรณกรรม
- โกเดฟรอย เจจิตวิทยาคืออะไร. - ม., 2535.
- Chatillon G., 2520. Statistique en Sciences humaines, Trois-Rivieres, Ed. เอสเอ็มจี.
- กิลเบิร์ต เอ็น. 2521 สถิติ มอนทรีออล เอ็ด เอช.อาร์.ดับบลิว.
- โมโรนีย์ เอ็ม.เจ. 2513. Comprendre la statistique, Verviers, Gerard et Cie.
- ซีเกล เอส.พ.ศ. 2499 สถิติแบบไม่อิงพารามิเตอร์ นิวยอร์ก บริษัท MacGraw-Hill Book
แอปพลิเคชันสเปรดชีต
หมายเหตุ 1) สำหรับตัวอย่างขนาดใหญ่หรือระดับนัยสำคัญน้อยกว่า 0.05 ให้อ้างอิงตารางในตำราสถิติ
2) ตารางค่าสำหรับเกณฑ์ที่ไม่ใช่พารามิเตอร์อื่น ๆ สามารถพบได้ในแนวทางพิเศษ (ดูบรรณานุกรม)
ตารางที่ 1. ค่าเกณฑ์ ทีนักเรียน | |
ชม. | 0,05 |
1 | 6,31 |
2 | 2,92 |
3 | 2,35 |
4 | 2,13 |
5 | 2,02 |
6 | 1,94 |
7 | 1,90 |
8 | 1,86 |
9 | 1,83 |
10 | 1,81 |
11 | 1,80 |
12 | 1,78 |
13 | 1,77 |
14 | 1,76 |
15 | 1,75 |
16 | 1,75 |
17 | 1,74 |
18 | 1,73 |
19 | 1,73 |
20 | 1,73 |
21 | 1,72 |
22 | 1,72 |
23 | 1,71 |
24 | 1,71 |
25 | 1,71 |
26 | 1,71 |
27 | 1,70 |
28 | 1,70 |
29 | 1,70 |
30 | 1,70 |
40 | 1,68 |
¥ | 1,65 |
ตารางที่ 2 ค่าของเกณฑ์ χ 2 | |
ชม. | 0,05 |
1 | 3,84 |
2 | 5,99 |
3 | 7,81 |
4 | 9,49 |
5 | 11,1 |
6 | 12,6 |
7 | 14,1 |
8 | 15,5 |
9 | 16,9 |
10 | 18,3 |
ตารางที่ 3 ค่า Z ที่เชื่อถือได้ | |
ร | Z |
0,05 | 1,64 |
0,01 | 2,33 |
ตารางที่ 4. ค่าที่เชื่อถือได้ (วิกฤต) ของ r | ||
ชั่วโมง = (N-2) | พี= 0,05 (5%) | |
3 | 0,88 | |
4 | 0,81 | |
5 | 0,75 | |
6 | 0,71 | |
7 | 0,67 | |
8 | 0,63 | |
9 | 0,60 | |
10 | 0,58 | |
11 | 0.55 | |
12 | 0,53 | |
13 | 0,51 | |
14 | 0,50 | |
15 | 0,48 | |
16 | 0,47 | |
17 | 0,46 | |
18 | 0,44 | |
19 | 0,43 | |
20 | 0,42 |
ตารางที่ 5 ค่าที่เชื่อถือได้ (สำคัญ) ของ r s | |
ชั่วโมง = (N-2) | พี = 0,05 |
2 | 1,000 |
3 | 0,900 |
4 | 0,829 |
5 | 0,714 |
6 | 0,643 |
7 | 0,600 |
8 | 0,564 |
10 | 0,506 |
12 | 0,456 |
14 | 0,425 |
16 | 0,399 |
18 | 0,377 |
20 | 0,359 |
22 | 0,343 |
24 | 0,329 |
26 | 0,317 |
28 | 0,306 |
ค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าที่สามารถเปลี่ยนแปลงได้ตั้งแต่ +1 ถึง -1 ในกรณีของความสัมพันธ์เชิงบวกที่สมบูรณ์ ค่าสัมประสิทธิ์นี้จะเท่ากับบวก 1 (พวกเขากล่าวว่าเมื่อค่าของตัวแปรหนึ่งเพิ่มขึ้น ค่าของตัวแปรอื่นจะเพิ่มขึ้น) และด้วยความสัมพันธ์เชิงลบที่สมบูรณ์ - ลบ 1 (ระบุข้อเสนอแนะ เช่น เมื่อค่าของตัวแปรหนึ่งเพิ่มขึ้น ค่าของอีกตัวแปรหนึ่งจะลดลง)
อดีต 1:
กราฟการพึ่งพาความประหม่าและภาวะซึมเศร้า อย่างที่คุณเห็น จุด (หัวเรื่อง) ไม่ได้อยู่แบบสุ่ม แต่เรียงกันเป็นแถวหนึ่งบรรทัด และเมื่อดูที่บรรทัดนี้ เราสามารถพูดได้ว่ายิ่งแสดงอาการเขินอายในบุคคลมากเท่าไหร่ อาการซึมเศร้าก็จะยิ่งมากขึ้นเท่านั้น เช่น ปรากฏการณ์เหล่านี้ มีการเชื่อมต่อกัน
ตัวอย่างที่ 2: กราฟสำหรับความประหม่าและการเข้าสังคม เราเห็นว่าเมื่อความเขินอายเพิ่มขึ้น ความเป็นกันเองก็ลดลง ค่าสัมประสิทธิ์สหสัมพันธ์คือ -0.43 ดังนั้น ค่าสัมประสิทธิ์สหสัมพันธ์ที่มากกว่า 0 ถึง 1 บ่งชี้ถึงความสัมพันธ์แบบสัดส่วนโดยตรง (ยิ่งมาก ... ยิ่งมาก) และค่าสัมประสิทธิ์ตั้งแต่ -1 ถึง 0 บ่งชี้ถึงความสัมพันธ์แบบสัดส่วนผกผัน (ยิ่งมาก ... ยิ่งน้อย . ..)
ถ้าสัมประสิทธิ์สหสัมพันธ์เป็น 0 ตัวแปรทั้งสองจะเป็นอิสระจากกันโดยสิ้นเชิง
ความสัมพันธ์- นี่คือความสัมพันธ์ที่ผลกระทบของปัจจัยแต่ละอย่างปรากฏเป็นแนวโน้มเท่านั้น (โดยเฉลี่ย) กับการสังเกตข้อมูลจริงจำนวนมาก ตัวอย่างของการพึ่งพาความสัมพันธ์อาจเป็นการพึ่งพาระหว่างขนาดสินทรัพย์ของธนาคารและจำนวนกำไรของธนาคาร การเติบโตของผลิตภาพแรงงานและอายุงานของพนักงาน
มีการใช้ระบบการจำแนกความสัมพันธ์สองระบบตามความแข็งแกร่ง: ทั่วไปและเฉพาะ
การจำแนกความสัมพันธ์โดยทั่วไป: 1) สูงหรือใกล้เคียงด้วยค่าสัมประสิทธิ์สหสัมพันธ์ r> 0.70; 2) ปานกลางที่ 0.500.70 และไม่ใช่แค่ความสัมพันธ์ที่มีนัยสำคัญระดับสูงเท่านั้นตารางต่อไปนี้แสดงชื่อค่าสัมประสิทธิ์สหสัมพันธ์สำหรับมาตราส่วนประเภทต่างๆ
สเกลสองขั้ว (1/0) | ระดับอันดับ (ลำดับ) | ||
สเกลสองขั้ว (1/0) | ค่าสัมประสิทธิ์การเชื่อมโยงของเพียร์สัน ค่าสัมประสิทธิ์การผันสี่เซลล์ของเพียร์สัน | ความสัมพันธ์แบบทวิภาค | |
ระดับอันดับ (ลำดับ) | ความสัมพันธ์ระหว่างอันดับและทวิภาค | ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของสเปียร์แมนหรือเคนดัลล์ | |
ช่วงเวลาและมาตราส่วนสัมบูรณ์ | ความสัมพันธ์แบบทวิภาค | ค่าของมาตราส่วนช่วงเวลาจะถูกแปลงเป็นอันดับและใช้ค่าสัมประสิทธิ์อันดับ | ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน (ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้น) |
ที่ ร=0 ไม่มีความสัมพันธ์เชิงเส้น ในกรณีนี้ ค่าเฉลี่ยกลุ่มของตัวแปรตรงกับค่าเฉลี่ยทั่วไป และเส้นถดถอยจะขนานกับแกนพิกัด
ความเท่าเทียมกัน ร=0 พูดถึงเฉพาะการไม่มีการพึ่งพาความสัมพันธ์เชิงเส้น (ตัวแปรที่ไม่มีความสัมพันธ์กัน) แต่ไม่ใช่โดยทั่วไปเกี่ยวกับการขาดความสัมพันธ์ และยิ่งกว่านั้น การพึ่งพาทางสถิติ
บางครั้งข้อสรุปที่ว่าไม่มีความสัมพันธ์กันนั้นสำคัญกว่าการมีความสัมพันธ์ที่แน่นแฟ้น ความสัมพันธ์ที่เป็นศูนย์ของตัวแปรสองตัวอาจบ่งชี้ว่าตัวแปรหนึ่งไม่มีอิทธิพลต่ออีกตัวแปรหนึ่ง โดยมีเงื่อนไขว่าเราต้องเชื่อถือผลลัพธ์ของการวัด
ใน SPSS: 11.3.2 ค่าสัมประสิทธิ์สหสัมพันธ์
จนถึงขณะนี้ เราได้ค้นพบเพียงข้อเท็จจริงของการมีอยู่ของความสัมพันธ์ทางสถิติระหว่างสองคุณลักษณะ ต่อไปเราจะพยายามค้นหาข้อสรุปที่สามารถสรุปได้เกี่ยวกับจุดแข็งหรือจุดอ่อนของการพึ่งพาอาศัยกันนี้ ตลอดจนรูปแบบและทิศทางของมัน เกณฑ์สำหรับการวัดปริมาณความสัมพันธ์ระหว่างตัวแปรเรียกว่าค่าสัมประสิทธิ์สหสัมพันธ์หรือการวัดความเชื่อมโยง ตัวแปรสองตัวมีความสัมพันธ์เชิงบวกหากมีความสัมพันธ์โดยตรงและทิศทางเดียวระหว่างตัวแปรทั้งสอง ในความสัมพันธ์แบบทิศทางเดียว ค่าน้อยของตัวแปรหนึ่งสอดคล้องกับค่าน้อยของตัวแปรอื่น ค่ามากตรงกับค่ามาก ตัวแปรสองตัวมีความสัมพันธ์เชิงลบหากมีความสัมพันธ์แบบผกผันระหว่างตัวแปรทั้งสอง ด้วยความสัมพันธ์แบบหลายทิศทาง ค่าเล็กน้อยของตัวแปรหนึ่งจะสอดคล้องกับค่าขนาดใหญ่ของตัวแปรอื่นและในทางกลับกัน ค่าของสัมประสิทธิ์สหสัมพันธ์จะอยู่ในช่วงตั้งแต่ -1 ถึง +1 เสมอ
ค่าสัมประสิทธิ์ของสเปียร์แมนถูกใช้เป็นค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรที่อยู่ในสเกลลำดับ และค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน (โมเมนต์ของผลิตภัณฑ์) ใช้สำหรับตัวแปรที่อยู่ในสเกลช่วงเวลา ในกรณีนี้ ควรสังเกตว่าแต่ละตัวแปรแบบสองขั้ว นั่นคือ ตัวแปรที่อยู่ในมาตราส่วนเล็กน้อยและมีสองประเภท สามารถพิจารณาได้ว่าเป็นลำดับ
ก่อนอื่น เราจะตรวจสอบว่ามีความสัมพันธ์ระหว่างตัวแปรเพศและจิตใจจากไฟล์ studium.sav หรือไม่ ในการทำเช่นนั้น เราพิจารณาว่าเพศของตัวแปรสองขั้วถือเป็นตัวแปรลำดับ ทำดังต่อไปนี้:
เลือกจากเมนูคำสั่ง วิเคราะห์ (การวิเคราะห์) สถิติเชิงพรรณนา (สถิติเชิงพรรณนา) ครอสแท็บ... (ตารางฉุกเฉิน)
· ย้ายตัวแปรเพศไปยังรายการของแถว และตัวแปรจิตใจไปยังรายการของคอลัมน์
· คลิกปุ่มสถิติ... ในกล่องโต้ตอบแท็บไขว้: สถิติ ให้เลือกกล่องความสัมพันธ์ ยืนยันการเลือกของคุณด้วยปุ่มดำเนินการต่อ
· ในไดอะล็อกแท็บไขว้ ให้หยุดแสดงตารางโดยทำเครื่องหมายที่ช่องทำเครื่องหมาย ระงับตาราง คลิกปุ่มตกลง
ค่าสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมนและเพียร์สันจะถูกคำนวณ และจะมีการทดสอบนัยสำคัญ:
/สพปส.10
งานหมายเลข 10 การวิเคราะห์ความสัมพันธ์
แนวคิดของความสัมพันธ์
สหสัมพันธ์หรือค่าสัมประสิทธิ์สหสัมพันธ์เป็นตัวบ่งชี้ทางสถิติ ความน่าจะเป็นความสัมพันธ์ระหว่างตัวแปรสองตัวที่วัดด้วยมาตราส่วนเชิงปริมาณ ตรงกันข้ามกับการเชื่อมต่อการทำงานซึ่งแต่ละค่าของตัวแปรหนึ่งตัวสัมพันธ์กัน กำหนดไว้อย่างเคร่งครัดค่าของตัวแปรอื่น การเชื่อมต่อความน่าจะเป็นโดดเด่นด้วยความจริงที่ว่าแต่ละค่าของตัวแปรหนึ่งสอดคล้องกับ ชุดค่าอีกตัวแปรหนึ่ง ตัวอย่างของความสัมพันธ์เชิงความน่าจะเป็นคือความสัมพันธ์ระหว่างส่วนสูงและน้ำหนักของคน เป็นที่ชัดเจนว่าคนที่มีน้ำหนักต่างกันสามารถมีส่วนสูงเท่ากันและในทางกลับกัน
ความสัมพันธ์คือค่าระหว่าง -1 ถึง + 1 และเขียนแทนด้วยตัวอักษร r ยิ่งกว่านั้นหากค่าเข้าใกล้ 1 แสดงว่ามีการเชื่อมต่อที่แข็งแกร่งและหากมีค่าใกล้เคียงกับ 0 แสดงว่าเป็นการเชื่อมต่อที่อ่อนแอ ค่าสหสัมพันธ์น้อยกว่า 0.2 ถือเป็นความสัมพันธ์ที่อ่อนแอ มากกว่า 0.5 - สูง ถ้าค่าสัมประสิทธิ์สหสัมพันธ์เป็นลบ แสดงว่ามีความสัมพันธ์แบบผกผัน: ยิ่งค่าของตัวแปรหนึ่งมีค่าสูง ค่าของอีกตัวแปรหนึ่งก็จะยิ่งต่ำลง
ขึ้นอยู่กับค่าที่ยอมรับของค่าสัมประสิทธิ์ r ความสัมพันธ์ประเภทต่าง ๆ สามารถแยกแยะได้:
ความสัมพันธ์เชิงบวกที่แข็งแกร่งถูกกำหนดโดยค่า r=1 คำว่า "เข้มงวด" หมายความว่าค่าของตัวแปรหนึ่งถูกกำหนดโดยค่าของตัวแปรอื่นโดยไม่ซ้ำกันและคำว่า " เชิงบวก" -เมื่อค่าของตัวแปรหนึ่งเพิ่มขึ้น ค่าของตัวแปรอีกตัวก็จะเพิ่มขึ้นด้วย
ความสัมพันธ์อย่างเข้มงวดเป็นนามธรรมทางคณิตศาสตร์และแทบไม่เคยเกิดขึ้นในการวิจัยจริง
ความสัมพันธ์เชิงบวกสอดคล้องกับค่า 0
ขาดความสัมพันธ์ถูกกำหนดโดยค่า r=0 ค่าสัมประสิทธิ์สหสัมพันธ์เป็นศูนย์แสดงว่าค่าของตัวแปรไม่เกี่ยวข้องกันแต่อย่างใด
ขาดความสัมพันธ์ ชม โอ : 0 ร xy =0 กำหนดเป็นภาพสะท้อน โมฆะสมมติฐานในการวิเคราะห์ความสัมพันธ์
ความสัมพันธ์เชิงลบ: -1
ความสัมพันธ์เชิงลบที่แข็งแกร่งกำหนดโดยค่า r= -1 เช่นเดียวกับความสัมพันธ์เชิงบวกที่เข้มงวด เป็นนามธรรมและไม่พบการแสดงออกในการวิจัยเชิงปฏิบัติ
ตารางที่ 1
ประเภทของความสัมพันธ์และคำจำกัดความ
วิธีการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ขึ้นอยู่กับประเภทของมาตราส่วนที่วัดค่าของตัวแปร
ค่าสัมประสิทธิ์สหสัมพันธ์ รเพียร์สันเป็นตัวหลักและสามารถใช้สำหรับตัวแปรที่มีสเกลช่วงเวลาเล็กน้อยและสั่งซื้อบางส่วน การกระจายของค่าที่สอดคล้องกับปกติ (ความสัมพันธ์ของช่วงเวลาผลิตภัณฑ์) ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันให้ผลลัพธ์ที่ค่อนข้างแม่นยำในกรณีของการแจกแจงที่ผิดปกติเช่นกัน
สำหรับการแจกแจงที่ไม่ปกติ ควรใช้ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของสเปียร์แมนและเคนดัลล์ มีการจัดอันดับเนื่องจากโปรแกรมจัดลำดับล่วงหน้าของตัวแปรที่สัมพันธ์กัน
โปรแกรม SPSS คำนวณความสัมพันธ์ r-Spearman ดังนี้ ขั้นแรก ตัวแปรจะถูกแปลงเป็นลำดับ จากนั้นจึงใช้สูตรเพียร์สันกับอันดับ
ความสัมพันธ์ที่เสนอโดย M. Kendall นั้นขึ้นอยู่กับแนวคิดที่ว่าทิศทางของการเชื่อมต่อสามารถตัดสินได้โดยการเปรียบเทียบอาสาสมัครเป็นคู่ ถ้าสำหรับคู่ของเรื่อง การเปลี่ยนแปลงใน X ไปในทิศทางเดียวกับการเปลี่ยนแปลงใน Y พร้อมกัน แสดงว่ามีความสัมพันธ์เชิงบวก หากไม่ตรงกันก็เกี่ยวกับความสัมพันธ์เชิงลบ ค่าสัมประสิทธิ์นี้ส่วนใหญ่ใช้โดยนักจิตวิทยาที่ทำงานกับกลุ่มตัวอย่างขนาดเล็ก เนื่องจากนักสังคมวิทยาทำงานกับอาร์เรย์ข้อมูลขนาดใหญ่ จึงเป็นเรื่องยากที่จะเรียงลำดับคู่ ระบุความแตกต่างของความถี่สัมพัทธ์และการผกผันของคู่เรื่องทั้งหมดในตัวอย่าง ที่พบมากที่สุดคือค่าสัมประสิทธิ์ เพียร์สัน
เนื่องจากค่าสัมประสิทธิ์สหสัมพันธ์ rPearson เป็นค่าหลักและสามารถใช้ได้ (โดยมีข้อผิดพลาดบ้างขึ้นอยู่กับชนิดของมาตราส่วนและระดับความผิดปกติในการแจกแจง) สำหรับตัวแปรทั้งหมดที่วัดด้วยมาตราส่วนเชิงปริมาณ เราจะพิจารณาตัวอย่างการใช้และเปรียบเทียบ ผลลัพธ์ที่ได้กับผลการวัดโดยใช้ค่าสัมประสิทธิ์สหสัมพันธ์อื่น ๆ
สูตรคำนวณค่าสัมประสิทธิ์ ร- เพียร์สัน:
r xy = ∑ (ซี-ซาฟ)∙(ยี่-ยัฟ) / (N-1)∙σ x ∙σ y ∙
ที่ไหน: Xi, Yi- ค่าของตัวแปรสองตัว
Xav, Yav - ค่าเฉลี่ยของสองตัวแปร
σ x , σ y คือส่วนเบี่ยงเบนมาตรฐาน
N คือจำนวนการสังเกต
ความสัมพันธ์แบบคู่
ตัวอย่างเช่น เราต้องการค้นหาว่าคำตอบระหว่างค่านิยมดั้งเดิมประเภทต่างๆ มีความสัมพันธ์กับแนวคิดของนักเรียนเกี่ยวกับสถานที่ทำงานในอุดมคติอย่างไร (ตัวแปร: a9.1, a9.3, a9.5, a9.7) แล้วเกี่ยวกับอัตราส่วนของค่านิยมเสรีนิยม (a9 .2, a9.4, a9.6, a9.8) ตัวแปรเหล่านี้วัดจากมาตราส่วนตามคำสั่ง 5 ระยะ
เราใช้ขั้นตอน: "การวิเคราะห์", "ความสัมพันธ์", "จับคู่" โดยค่าเริ่มต้น ค่าสัมประสิทธิ์ เพียร์สันถูกตั้งค่าในกล่องโต้ตอบ เราใช้ค่าสัมประสิทธิ์ เพียร์สัน
ตัวแปรที่ทดสอบจะถูกถ่ายโอนไปยังหน้าต่างการเลือก: a9.1, a9.3, a9.5, a9.7
เมื่อกดตกลง เราจะได้รับการคำนวณ:
ความสัมพันธ์
a9.1.t. การมีเวลาเพียงพอสำหรับครอบครัวและชีวิตส่วนตัวมีความสำคัญอย่างไร? |
ความสัมพันธ์แบบเพียร์สัน |
||||
ค่า (2 ด้าน) |
|||||
a9.3.t. การไม่กลัวตกงานสำคัญแค่ไหน? |
ความสัมพันธ์แบบเพียร์สัน |
||||
ค่า (2 ด้าน) |
|||||
a9.5.t. การมีเจ้านายแบบนี้คอยให้คำปรึกษากับคุณเมื่อต้องตัดสินใจเรื่องนี้มีความสำคัญแค่ไหน? |
ความสัมพันธ์แบบเพียร์สัน |
||||
ค่า (2 ด้าน) |
|||||
a9.7.t. การทำงานเป็นทีมที่มีการประสานงานกันดี การรู้สึกเหมือนเป็นส่วนหนึ่งของทีมมีความสำคัญอย่างไร |
ความสัมพันธ์แบบเพียร์สัน |
||||
ค่า (2 ด้าน) |
|||||
** ความสัมพันธ์มีนัยสำคัญที่ระดับ 0.01 (2 ด้าน)
ตารางค่าเชิงปริมาณของเมทริกซ์สหสัมพันธ์ที่สร้างขึ้น
ความสัมพันธ์บางส่วน:
ก่อนอื่นมาสร้างความสัมพันธ์แบบคู่ระหว่างตัวแปรทั้งสองนี้:
ความสัมพันธ์ |
|||
ค8. รู้สึกใกล้ชิดกับผู้ที่อาศัยอยู่ใกล้คุณ เพื่อนบ้าน |
ความสัมพันธ์แบบเพียร์สัน |
||
ค่า (2 ด้าน) |
|||
ค12. รู้สึกใกล้ชิดกับครอบครัวของพวกเขา |
ความสัมพันธ์แบบเพียร์สัน |
||
ค่า (2 ด้าน) |
|||
**. มีความสัมพันธ์อย่างมีนัยสำคัญทางสถิติที่ระดับ 0.01 (2 ด้าน) |
จากนั้นเราใช้ขั้นตอนในการสร้างความสัมพันธ์บางส่วน: "การวิเคราะห์", "ความสัมพันธ์", "บางส่วน"
สมมติว่าค่า "เป็นสิ่งสำคัญที่จะต้องกำหนดและเปลี่ยนแปลงลำดับงานของคุณอย่างอิสระ" ซึ่งสัมพันธ์กับตัวแปรที่ระบุจะเป็นปัจจัยชี้ขาดภายใต้อิทธิพลของความสัมพันธ์ที่ระบุก่อนหน้านี้จะหายไปหรือมีความสำคัญเพียงเล็กน้อย .
ความสัมพันธ์ |
||||
ตัวแปรที่ยกเว้น |
ค8. รู้สึกใกล้ชิดกับผู้ที่อาศัยอยู่ใกล้คุณ เพื่อนบ้าน |
ค12. รู้สึกใกล้ชิดกับครอบครัวของพวกเขา |
||
ค16. รู้สึกใกล้ชิดกับคนที่มีความมั่งคั่งเช่นเดียวกับคุณ |
ค8. รู้สึกใกล้ชิดกับผู้ที่อาศัยอยู่ใกล้คุณ เพื่อนบ้าน |
ความสัมพันธ์ |
||
นัยสำคัญ (2 ด้าน) |
||||
ค12. รู้สึกใกล้ชิดกับครอบครัวของพวกเขา |
ความสัมพันธ์ |
|||
นัยสำคัญ (2 ด้าน) |
||||
ดังที่เห็นได้จากตาราง ภายใต้อิทธิพลของตัวแปรควบคุม ความสัมพันธ์ลดลงเล็กน้อย: จาก 0.120 เป็น 0.102 มันยังคงสูงเพียงพอและอนุญาตให้หักล้างสมมติฐานว่างที่มีข้อผิดพลาดเป็นศูนย์
ค่าสัมประสิทธิ์สหสัมพันธ์
วิธีที่ถูกต้องที่สุดในการกำหนดความหนาแน่นและลักษณะของความสัมพันธ์คือการหาค่าสัมประสิทธิ์สหสัมพันธ์ ค่าสัมประสิทธิ์สหสัมพันธ์คือตัวเลขที่กำหนดโดยสูตร:
โดยที่ r xy คือสัมประสิทธิ์สหสัมพันธ์
x ผม -ค่าของคุณลักษณะแรก
ฉัน - ค่าของคุณลักษณะที่สอง
ค่าเฉลี่ยเลขคณิตของค่าของคุณลักษณะแรก
ค่าเฉลี่ยเลขคณิตของค่าของคุณสมบัติที่สอง
ในการใช้สูตร (32) เราสร้างตารางที่จะให้ลำดับที่จำเป็นในการเตรียมตัวเลขเพื่อหาตัวเศษและตัวส่วนของค่าสัมประสิทธิ์สหสัมพันธ์
ดังที่เห็นได้จากสูตร (32) ลำดับของการกระทำมีดังนี้: เราพบค่าเฉลี่ยเลขคณิตของทั้งเครื่องหมาย x และ y เราพบความแตกต่างระหว่างค่าของเครื่องหมายและค่าเฉลี่ย (x i - ) และ y ผม - ) จากนั้นเราจะพบผลคูณของพวกมัน (x ผม - ) ( y ผม - ) – ผลรวมของค่าหลังให้ตัวเศษของค่าสัมประสิทธิ์สหสัมพันธ์ ในการหาตัวส่วน ควรนำผลต่างยกกำลังสอง (x i -) และ (y i -) หาผลบวกและแยกรากที่สองออกจากผลคูณ
ตัวอย่างเช่น 31 การหาค่าสัมประสิทธิ์สหสัมพันธ์ตามสูตร (32) สามารถแสดงได้ดังนี้ (ตารางที่ 50)
จำนวนผลลัพธ์ของค่าสัมประสิทธิ์สหสัมพันธ์ทำให้สามารถสร้างสถานะ ความใกล้ชิด และลักษณะของความสัมพันธ์ได้
1. ถ้าค่าสัมประสิทธิ์สหสัมพันธ์เป็นศูนย์ แสดงว่าไม่มีความสัมพันธ์ระหว่างคุณสมบัติ
2. หากค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับหนึ่ง ความสัมพันธ์ระหว่างคุณลักษณะต่างๆ นั้นยิ่งใหญ่จนกลายเป็นความสัมพันธ์ที่ใช้งานได้
3. ค่าสัมบูรณ์ของค่าสัมประสิทธิ์สหสัมพันธ์ไม่เกินช่วงจากศูนย์ถึงหนึ่ง:
สิ่งนี้ทำให้สามารถมุ่งเน้นไปที่ความแน่นของการเชื่อมต่อ: ยิ่งค่าสัมประสิทธิ์เข้าใกล้ศูนย์มากเท่าไหร่ การเชื่อมต่อก็จะยิ่งอ่อนแอลงเท่านั้น
4. เครื่องหมายของค่าสัมประสิทธิ์สหสัมพันธ์ "บวก" หมายถึงความสัมพันธ์โดยตรง เครื่องหมาย "ลบ" หมายถึงตรงกันข้าม
โต๊ะ 50
x ฉัน | ผม | (x ฉัน - ) | (ย ฉัน - ) | (x ฉัน - )(y ฉัน - ) | (x ฉัน - )2 | (y ฉัน - )2 |
14,00 | 12,10 | -1,70 | -2,30 | +3,91 | 2,89 | 5,29 |
14,20 | 13,80 | -1,50 | -0,60 | +0,90 | 2,25 | 0,36 |
14,90 | 14,20 | -0,80 | -0,20 | +0,16 | 0,64 | 0,04 |
15,40 | 13,00 | -0,30 | -1,40 | +0,42 | 0,09 | 1,96 |
16,00 | 14,60 | +0,30 | +0,20 | +0,06 | 0,09 | 0,04 |
17,20 | 15,90 | +1,50 | +2,25 | 2,25 | ||
18,10 | 17,40 | +2,40 | +2,00 | +4,80 | 5,76 | 4,00 |
109,80 | 101,00 | 12,50 | 13,97 | 13,94 |
ดังนั้น สัมประสิทธิ์สหสัมพันธ์ที่คำนวณในตัวอย่างที่ 31 คือ r xy = +0.9 ทำให้เราได้ข้อสรุปดังต่อไปนี้: มีความสัมพันธ์ระหว่างขนาดของความแข็งแรงของกล้ามเนื้อของมือขวาและมือซ้ายในเด็กนักเรียนที่ศึกษา (ค่าสัมประสิทธิ์ r xy \u003d + 0.9 ไม่ใช่ศูนย์) ความสัมพันธ์ใกล้เคียงกันมาก (ค่าสัมประสิทธิ์ r xy \u003d + 0.9 ใกล้เคียงกับความสามัคคี) ความสัมพันธ์โดยตรง (ค่าสัมประสิทธิ์ r xy = +0.9 เป็นบวก) เช่น เมื่อความแข็งแรงของกล้ามเนื้อของมือข้างหนึ่งเพิ่มขึ้นความแข็งแรงของมืออีกข้างหนึ่งจะเพิ่มขึ้น
เมื่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์และใช้คุณสมบัติของมัน ควรคำนึงถึงข้อสรุปที่ให้ผลลัพธ์ที่ถูกต้องเมื่อมีการกระจายคุณสมบัติตามปกติและเมื่อพิจารณาความสัมพันธ์ระหว่างค่าจำนวนมากของคุณสมบัติทั้งสอง
ในตัวอย่างที่พิจารณา 31 มีการวิเคราะห์คุณลักษณะทั้งสองเพียง 7 ค่าซึ่งแน่นอนว่าไม่เพียงพอสำหรับการศึกษาดังกล่าว ขอย้ำเตือนอีกครั้งว่าตัวอย่างในหนังสือเล่มนี้โดยทั่วไปและโดยเฉพาะในบทนี้ มีลักษณะเป็นวิธีการแสดงภาพประกอบ ไม่ใช่การนำเสนอโดยละเอียดของการทดลองทางวิทยาศาสตร์ใดๆ เป็นผลให้มีการพิจารณาค่าคุณลักษณะจำนวนเล็กน้อยการวัดจะถูกปัดเศษ - ทั้งหมดนี้ทำเพื่อไม่ให้บดบังแนวคิดของวิธีการด้วยการคำนวณที่ยุ่งยาก
ควรให้ความสนใจเป็นพิเศษกับสาระสำคัญของความสัมพันธ์ภายใต้การพิจารณา ค่าสัมประสิทธิ์สหสัมพันธ์ไม่สามารถนำไปสู่ผลลัพธ์ที่ถูกต้องของการศึกษาได้ หากการวิเคราะห์ความสัมพันธ์ระหว่างคุณลักษณะนั้นดำเนินการอย่างเป็นทางการ กลับไปที่ตัวอย่างที่ 31 สัญญาณที่พิจารณาทั้งสองคือค่าความแข็งแรงของกล้ามเนื้อของมือขวาและมือซ้าย ลองจินตนาการว่าโดยคุณลักษณะ x i ในตัวอย่างที่ 31 (14.0; 14.2; 14.9... ...18.1) เราหมายถึงความยาวของปลาที่สุ่มจับได้เป็นเซนติเมตร และโดยคุณลักษณะ y i (12.1 ; 13.8; 14.2 ... ... 17.4) - น้ำหนักของเครื่องมือในห้องปฏิบัติการเป็นกิโลกรัม อย่างเป็นทางการ โดยใช้อุปกรณ์ในการคำนวณเพื่อหาค่าสัมประสิทธิ์สหสัมพันธ์ และในกรณีนี้ยังได้ r xy =+0>9 เราควรสรุปได้ว่ามีความสัมพันธ์ใกล้ชิดโดยธรรมชาติระหว่างความยาวของปลากับน้ำหนักของปลา เครื่องมือ ความไร้เหตุผลของข้อสรุปดังกล่าวนั้นชัดเจน
เพื่อหลีกเลี่ยงวิธีการที่เป็นทางการในการใช้ค่าสัมประสิทธิ์สหสัมพันธ์ เราควรใช้วิธีการอื่นใด - ทางคณิตศาสตร์ ตรรกะ การทดลอง ทางทฤษฎี - เพื่อระบุความเป็นไปได้ของความสัมพันธ์ระหว่างสัญญาณ นั่นคือ เพื่อตรวจหาเอกภาพของสัญญาณ จากนั้นเราจึงจะเริ่มใช้การวิเคราะห์ความสัมพันธ์และสร้างขนาดและลักษณะของความสัมพันธ์ได้
ในสถิติทางคณิตศาสตร์ก็มีแนวคิดเช่นกัน ความสัมพันธ์ที่หลากหลาย- ความสัมพันธ์ระหว่างคุณลักษณะตั้งแต่สามอย่างขึ้นไป ในกรณีเหล่านี้ จะใช้ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณ ซึ่งประกอบด้วยค่าสัมประสิทธิ์สหสัมพันธ์แบบคู่ที่อธิบายไว้ข้างต้น
ตัวอย่างเช่น ค่าสัมประสิทธิ์สหสัมพันธ์ของสามสัญญาณ - x і , y і , z і - คือ:
โดยที่ R xyz -ค่าสัมประสิทธิ์สหสัมพันธ์หลายค่าแสดงว่าคุณลักษณะ xi ขึ้นอยู่กับคุณลักษณะ y i และ zi อย่างไร ;
r xy - ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคุณสมบัติ x ผม และ y ผม ;
r xz - ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคุณสมบัติ Xi และ Zi
r yz - ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคุณสมบัติ y i , zi
การวิเคราะห์ความสัมพันธ์คือ:
การวิเคราะห์ความสัมพันธ์ความสัมพันธ์- ความสัมพันธ์ทางสถิติของตัวแปรสุ่มตั้งแต่สองตัวขึ้นไป (หรือตัวแปรที่สามารถพิจารณาได้ในระดับความแม่นยำที่ยอมรับได้) ในขณะเดียวกัน การเปลี่ยนแปลงในปริมาณเหล่านี้อย่างน้อยหนึ่งปริมาณจะนำไปสู่การเปลี่ยนแปลงอย่างเป็นระบบในปริมาณอื่นหรือปริมาณอื่น ค่าสัมประสิทธิ์สหสัมพันธ์ทำหน้าที่เป็นการวัดทางคณิตศาสตร์ของความสัมพันธ์ของตัวแปรสุ่มสองตัว
ความสัมพันธ์สามารถเป็นได้ทั้งบวกและลบ (เป็นไปได้ว่าไม่มีความสัมพันธ์ทางสถิติ - ตัวอย่างเช่น สำหรับตัวแปรสุ่มอิสระ) ความสัมพันธ์เชิงลบ - สหสัมพันธ์ ซึ่งการเพิ่มขึ้นของตัวแปรหนึ่งสัมพันธ์กับการลดลงของตัวแปรอื่น ในขณะที่ค่าสัมประสิทธิ์สหสัมพันธ์เป็นค่าลบ ความสัมพันธ์เชิงบวก - ความสัมพันธ์ที่การเพิ่มขึ้นของตัวแปรหนึ่งมีความสัมพันธ์กับการเพิ่มขึ้นของตัวแปรอื่น ในขณะที่ค่าสัมประสิทธิ์สหสัมพันธ์เป็นบวก
ความสัมพันธ์อัตโนมัติ - ความสัมพันธ์ทางสถิติระหว่างตัวแปรสุ่มจากซีรีส์เดียวกัน แต่ดำเนินการด้วยการเปลี่ยนแปลง ตัวอย่างเช่น สำหรับกระบวนการสุ่ม - มีการเปลี่ยนแปลงตามเวลา
วิธีการประมวลผลข้อมูลทางสถิติซึ่งประกอบด้วยการศึกษาค่าสัมประสิทธิ์ (สหสัมพันธ์) ระหว่างตัวแปรเรียกว่า การวิเคราะห์ความสัมพันธ์.
ค่าสัมประสิทธิ์สหสัมพันธ์
ค่าสัมประสิทธิ์สหสัมพันธ์หรือ ค่าสัมประสิทธิ์สหสัมพันธ์แบบคู่ในทฤษฎีความน่าจะเป็นและสถิติ นี่เป็นตัวบ่งชี้ธรรมชาติของการเปลี่ยนแปลงในตัวแปรสุ่มสองตัว ค่าสัมประสิทธิ์สหสัมพันธ์แสดงด้วยอักษรละติน R และสามารถรับค่าระหว่าง -1 ถึง +1 หากค่าโมดูโลเข้าใกล้ 1 แสดงว่ามีการเชื่อมต่อที่แข็งแกร่ง (โดยมีค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ 1 แสดงว่ามีการเชื่อมต่อที่ใช้งานได้) และถ้าเข้าใกล้ 0 แสดงว่าเป็นการเชื่อมต่อที่อ่อนแอ
ค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน
สำหรับปริมาณเมตริกจะใช้ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันซึ่งเป็นสูตรที่แน่นอนซึ่งนำเสนอโดย Francis Galton:
อนุญาต เอ็กซ์,วาย- ตัวแปรสุ่มสองตัวที่กำหนดไว้ในพื้นที่ความน่าจะเป็นเดียวกัน จากนั้นค่าสัมประสิทธิ์สหสัมพันธ์จะได้รับจากสูตร:
,โดยที่ cov คือความแปรปรวนร่วม และ D คือความแปรปรวน หรือเทียบเท่า
,โดยสัญลักษณ์แสดงถึงความคาดหวังทางคณิตศาสตร์
หากต้องการแสดงความสัมพันธ์ดังกล่าวในรูปแบบกราฟิก คุณสามารถใช้ระบบพิกัดสี่เหลี่ยมที่มีแกนที่สอดคล้องกับตัวแปรทั้งสองได้ ค่าแต่ละคู่จะถูกทำเครื่องหมายด้วยสัญลักษณ์เฉพาะ พล็อตดังกล่าวเรียกว่า "พล็อตกระจาย"
วิธีการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ขึ้นอยู่กับประเภทของสเกลที่ตัวแปรอ้างอิง ดังนั้น ในการวัดตัวแปรด้วยมาตราส่วนช่วงเวลาและเชิงปริมาณ จึงจำเป็นต้องใช้ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สัน (สหสัมพันธ์ของช่วงเวลาผลิตภัณฑ์) ถ้าอย่างน้อยหนึ่งในสองตัวแปรมีมาตราส่วนเชิงลำดับ หรือไม่ได้กระจายตามปกติ จะต้องใช้ความสัมพันธ์อันดับของ Spearman หรือ τ (tau) ของ Kendal ในกรณีที่ตัวแปรตัวใดตัวหนึ่งเป็นแบบสองขั้ว จะใช้ความสัมพันธ์แบบสองชุดแบบจุด และถ้าตัวแปรทั้งสองเป็นแบบสองขั้ว จะใช้ความสัมพันธ์แบบสี่ฟิลด์ การคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรที่ไม่แบ่งขั้วสองตัวนั้นสมเหตุสมผลก็ต่อเมื่อความสัมพันธ์ระหว่างตัวแปรทั้งสองเป็นแบบเส้นตรง (ทิศทางเดียว)
ค่าสัมประสิทธิ์สหสัมพันธ์ของเคนเดลล์
ใช้ในการวัดความผิดปกติร่วมกัน
ค่าสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน
คุณสมบัติของสัมประสิทธิ์สหสัมพันธ์
- Cauchy - ความไม่เท่าเทียมกันของ Bunyakovsky:
การวิเคราะห์ความสัมพันธ์
การวิเคราะห์ความสัมพันธ์- วิธีการประมวลผลข้อมูลทางสถิติซึ่งประกอบด้วยการศึกษาค่าสัมประสิทธิ์ ( ความสัมพันธ์) ระหว่างตัวแปร ในกรณีนี้ ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างคุณลักษณะหนึ่งคู่หรือหลายคู่จะถูกเปรียบเทียบเพื่อสร้างความสัมพันธ์ทางสถิติระหว่างทั้งสอง
เป้า การวิเคราะห์ความสัมพันธ์- ให้ข้อมูลบางอย่างเกี่ยวกับตัวแปรหนึ่งด้วยความช่วยเหลือของตัวแปรอื่น ในกรณีที่เป็นไปได้ที่จะบรรลุเป้าหมายเราจะบอกว่าตัวแปร สัมพันธ์กัน. ในรูปแบบทั่วไปส่วนใหญ่ การยอมรับสมมติฐานของการมีอยู่ของความสัมพันธ์หมายความว่าการเปลี่ยนแปลงในค่าของตัวแปร A จะเกิดขึ้นพร้อมกันกับการเปลี่ยนแปลงตามสัดส่วนในค่าของ B: ถ้าตัวแปรทั้งสองเพิ่มขึ้น ดังนั้น ความสัมพันธ์เป็นบวกถ้าตัวแปรหนึ่งเพิ่มขึ้นและอีกตัวแปรหนึ่งลดลง ความสัมพันธ์เป็นลบ.
ความสัมพันธ์สะท้อนถึงการพึ่งพาเชิงเส้นของปริมาณเท่านั้น แต่ไม่ได้สะท้อนถึงการเชื่อมต่อการทำงาน ตัวอย่างเช่น หากเราคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างค่าต่างๆ ก = สผมน(x) และ ข = คโอส(x) จากนั้นจะใกล้เคียงกับศูนย์นั่นคือไม่มีการพึ่งพาระหว่างปริมาณ ในขณะเดียวกัน ปริมาณ A และ B นั้นสัมพันธ์กันอย่างชัดเจนตามหน้าที่ตามกฎหมาย สผมน 2(x) + คโอส 2(x) = 1.
ข้อจำกัดของการวิเคราะห์ความสัมพันธ์
แผนภาพการแจกแจงของคู่ (x,y) พร้อมค่าสัมประสิทธิ์สหสัมพันธ์ x และ y ที่สอดคล้องกันสำหรับแต่ละคู่ โปรดทราบว่าค่าสัมประสิทธิ์สหสัมพันธ์สะท้อนถึงความสัมพันธ์เชิงเส้น (แถวบนสุด) แต่ไม่ได้อธิบายเส้นโค้งของความสัมพันธ์ (แถวกลาง) และไม่เหมาะสำหรับการอธิบายความสัมพันธ์ที่ซับซ้อนและไม่เป็นเชิงเส้น (แถวล่าง)
- การประยุกต์ใช้เป็นไปได้หากมีจำนวนกรณีศึกษาเพียงพอ: สำหรับค่าสัมประสิทธิ์สหสัมพันธ์ประเภทใดประเภทหนึ่ง จะมีค่าตั้งแต่ 25 ถึง 100 คู่ของการสังเกต
- ข้อจำกัดที่สองตามมาจากสมมติฐานของการวิเคราะห์สหสัมพันธ์ ซึ่งรวมถึง การพึ่งพาเชิงเส้นของตัวแปร. ในหลายกรณี เมื่อเป็นที่ทราบอย่างน่าเชื่อถือว่าการพึ่งพานั้นมีอยู่จริง การวิเคราะห์สหสัมพันธ์อาจไม่ให้ผลลัพธ์เพียงเพราะการพึ่งพานั้นไม่เป็นเชิงเส้น (แสดงเป็นพาราโบลา)
- โดยตัวของมันเองแล้ว ข้อเท็จจริงของความสัมพันธ์ไม่ได้ให้เหตุผลในการยืนยันว่าตัวแปรใดนำหน้าหรือทำให้เกิดการเปลี่ยนแปลง หรือตัวแปรนั้นมักเกี่ยวข้องกันในเชิงสาเหตุ ตัวอย่างเช่น เนื่องจากการกระทำของปัจจัยที่สาม
พื้นที่ใช้งาน
วิธีการประมวลผลข้อมูลทางสถิตินี้เป็นที่นิยมอย่างมากในด้านเศรษฐศาสตร์และสังคมศาสตร์ (โดยเฉพาะอย่างยิ่งในด้านจิตวิทยาและสังคมวิทยา) แม้ว่าขอบเขตของการใช้ค่าสัมประสิทธิ์สหสัมพันธ์จะกว้างขวาง: การควบคุมคุณภาพของผลิตภัณฑ์อุตสาหกรรม, โลหะวิทยา, เคมีเกษตร, อุทกชีววิทยา, ไบโอเมตริก และคนอื่น ๆ.
ความนิยมของวิธีนี้เกิดจากสองประเด็น: ค่าสัมประสิทธิ์สหสัมพันธ์นั้นค่อนข้างง่ายในการคำนวณ แอปพลิเคชันของพวกเขาไม่ต้องการการฝึกอบรมทางคณิตศาสตร์พิเศษ เมื่อรวมกับความง่ายในการตีความ ความง่ายในการใช้ค่าสัมประสิทธิ์ได้นำไปสู่การใช้อย่างแพร่หลายในด้านการวิเคราะห์ข้อมูลทางสถิติ
ความสัมพันธ์ปลอมๆ
ความเรียบง่ายที่ดึงดูดใจของการศึกษาความสัมพันธ์มักกระตุ้นให้ผู้วิจัยสรุปโดยสัญชาตญาณผิดๆ เกี่ยวกับการมีอยู่ของความสัมพันธ์เชิงสาเหตุระหว่างลักษณะคู่ ในขณะที่ค่าสัมประสิทธิ์สหสัมพันธ์สร้างความสัมพันธ์ทางสถิติเท่านั้น
ในระเบียบวิธีเชิงปริมาณสมัยใหม่ของสังคมศาสตร์ ความจริงแล้ว มีการละทิ้งความพยายามที่จะสร้างความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรที่สังเกตได้ด้วยวิธีการเชิงประจักษ์ ดังนั้น เมื่อนักวิจัยในสาขาสังคมศาสตร์พูดถึงการสร้างความสัมพันธ์ระหว่างตัวแปรที่พวกเขาศึกษา สมมติฐานทางทฤษฎีทั่วไปหรือการพึ่งพาทางสถิติก็มีความหมายโดยนัย
ดูสิ่งนี้ด้วย
- ฟังก์ชันความสัมพันธ์อัตโนมัติ
- ฟังก์ชันข้ามสหสัมพันธ์
- ความแปรปรวนร่วม
- ค่าสัมประสิทธิ์การกำหนด
- การวิเคราะห์การถดถอย
มูลนิธิวิกิมีเดีย 2553.
คุณลักษณะต่าง ๆ อาจเกี่ยวข้องกัน
มีการเชื่อมต่อ 2 ประเภทระหว่างพวกเขา:
- การทำงาน;
- ความสัมพันธ์
ความสัมพันธ์แปลเป็นภาษารัสเซีย - ไม่มีอะไรมากไปกว่าการเชื่อมต่อ
ในกรณีของความสัมพันธ์จะมีความสอดคล้องกันของค่าหลายค่าของแอตทริบิวต์หนึ่งกับค่าหลายค่าของแอตทริบิวต์อื่น ตัวอย่าง เราสามารถพิจารณาความสัมพันธ์ระหว่าง:
- ความยาวของอุ้งเท้า คอ และจงอยปากของนก เช่น นกกระสา นกกระเรียน นกกระสา
- ตัวบ่งชี้อุณหภูมิร่างกายและอัตราการเต้นของหัวใจ
สำหรับกระบวนการทางชีวการแพทย์ส่วนใหญ่ การเชื่อมต่อประเภทนี้ได้รับการพิสูจน์ทางสถิติแล้ว
วิธีการทางสถิติทำให้สามารถระบุข้อเท็จจริงของการมีอยู่ของการพึ่งพาซึ่งกันและกันของคุณลักษณะต่างๆ การใช้การคำนวณพิเศษสำหรับสิ่งนี้นำไปสู่การสร้างค่าสัมประสิทธิ์สหสัมพันธ์ (การวัดการเชื่อมต่อ)
การคำนวณดังกล่าวเรียกว่า การวิเคราะห์ความสัมพันธ์ดำเนินการเพื่อยืนยันการพึ่งพาของตัวแปร 2 ตัว (ตัวแปรสุ่ม) ซึ่งแสดงโดยค่าสัมประสิทธิ์สหสัมพันธ์
การใช้วิธีสหสัมพันธ์ช่วยให้เราแก้ปัญหาต่างๆ ได้:
- ระบุความสัมพันธ์ระหว่างพารามิเตอร์ที่วิเคราะห์
- ความรู้เกี่ยวกับการมีอยู่ของความสัมพันธ์ช่วยให้สามารถแก้ปัญหาการพยากรณ์ได้ ดังนั้นจึงมีความเป็นไปได้จริงที่จะทำนายพฤติกรรมของพารามิเตอร์ตามการวิเคราะห์พฤติกรรมของพารามิเตอร์อื่นที่สัมพันธ์กัน
- การจำแนกตามการเลือกคุณสมบัติที่เป็นอิสระจากกัน
สำหรับตัวแปร:
- ที่เกี่ยวข้องกับสเกลลำดับคำนวณค่าสัมประสิทธิ์สเปียร์แมน
- เกี่ยวข้องกับมาตราส่วนช่วงเวลา - ค่าสัมประสิทธิ์เพียร์สัน
พารามิเตอร์เหล่านี้เป็นพารามิเตอร์ที่ใช้บ่อยที่สุด แต่ก็มีพารามิเตอร์อื่นๆ
ค่าของสัมประสิทธิ์สามารถแสดงได้ทั้งค่าบวกและค่าลบ
ในกรณีแรกเมื่อค่าของตัวแปรหนึ่งเพิ่มขึ้นจะมีการสังเกตการเพิ่มขึ้นของตัวแปรที่สอง ด้วยค่าสัมประสิทธิ์ที่เป็นลบ รูปแบบจะกลับด้าน
ค่าสัมประสิทธิ์สหสัมพันธ์มีไว้เพื่ออะไร?
ตัวแปรสุ่มที่เชื่อมต่อกันอาจมีลักษณะที่แตกต่างกันโดยสิ้นเชิงของการเชื่อมต่อนี้ มันไม่จำเป็นต้องใช้งานได้ ในกรณีที่มีความสัมพันธ์โดยตรงระหว่างปริมาณ บ่อยครั้งที่ปริมาณทั้งสองได้รับผลกระทบจากปัจจัยต่าง ๆ ทั้งชุด ในกรณีที่พวกมันเหมือนกันกับปริมาณทั้งสอง การก่อตัวของรูปแบบที่เกี่ยวข้องจะถูกสังเกต
ซึ่งหมายความว่าข้อเท็จจริงที่พิสูจน์ทางสถิติของการมีอยู่ของความสัมพันธ์ระหว่างปริมาณไม่ได้เป็นการยืนยันว่าสาเหตุของการเปลี่ยนแปลงที่สังเกตได้ถูกสร้างขึ้น ตามกฎแล้ว ผู้วิจัยสรุปว่ามีผลที่สัมพันธ์กันสองประการ
คุณสมบัติของสัมประสิทธิ์สหสัมพันธ์
สถิตินี้มีคุณสมบัติดังต่อไปนี้:
- ค่าสัมประสิทธิ์อยู่ในช่วง -1 ถึง +1 ยิ่งเข้าใกล้ค่ามากเท่าใด ความสัมพันธ์เชิงบวกหรือเชิงลบระหว่างพารามิเตอร์เชิงเส้นก็ยิ่งแข็งแกร่งขึ้นเท่านั้น ในกรณีที่มีค่าเป็นศูนย์เรากำลังพูดถึงการไม่มีความสัมพันธ์ระหว่างคุณสมบัติ
- ค่าบวกของค่าสัมประสิทธิ์บ่งชี้ว่าในกรณีที่ค่าของแอตทริบิวต์หนึ่งเพิ่มขึ้นจะมีการสังเกตการเพิ่มขึ้นของค่าที่สอง (ความสัมพันธ์เชิงบวก)
- ค่าลบ - ในกรณีที่ค่าของแอตทริบิวต์หนึ่งเพิ่มขึ้นจะมีการสังเกตการลดลงของค่าที่สอง (ค่าสหสัมพันธ์เชิงลบ)
- การเข้าใกล้ค่าของตัวบ่งชี้จนถึงจุดสูงสุด (ทั้ง -1 หรือ +1) บ่งชี้ว่ามีความสัมพันธ์เชิงเส้นที่แข็งแกร่งมาก
- ตัวบ่งชี้ลักษณะสามารถเปลี่ยนแปลงได้ด้วยค่าคงที่ของค่าสัมประสิทธิ์
- ค่าสัมประสิทธิ์สหสัมพันธ์เป็นปริมาณที่ไม่มีมิติ
- การปรากฏตัวของความสัมพันธ์ไม่ได้เป็นการยืนยันความสัมพันธ์เชิงสาเหตุ
ค่าสัมประสิทธิ์สหสัมพันธ์
ความแข็งแกร่งของความสัมพันธ์สามารถระบุได้โดยใช้มาตราส่วน Cheldok ซึ่งลักษณะเชิงคุณภาพสอดคล้องกับค่าตัวเลขที่แน่นอน
ในกรณีที่มีความสัมพันธ์เชิงบวกที่ค่า:
- 0-0.3 - ความสัมพันธ์อ่อนแอมาก
- 0.3-0.5 - อ่อนแอ
- 0.5-0.7 - ความแรงปานกลาง
- 0.7-0.9 - สูง
- 0.9-1 - ความแข็งแรงของความสัมพันธ์ที่สูงมาก
สเกลนี้ยังสามารถใช้สำหรับความสัมพันธ์เชิงลบ ในกรณีนี้ ลักษณะเชิงคุณภาพจะถูกแทนที่ด้วยคุณสมบัติที่ตรงกันข้าม
คุณสามารถใช้มาตราส่วน Cheldok แบบง่ายซึ่งแยกแยะความแข็งแกร่งของความสัมพันธ์เพียง 3 ระดับเท่านั้น:
- แข็งแกร่งมาก - ตัวบ่งชี้± 0.7 - ± 1;
- ค่าเฉลี่ย - ตัวบ่งชี้ ± 0.3 - ± 0.699;
- อ่อนแอมาก - ตัวบ่งชี้ 0 - ± 0.299
ตัวบ่งชี้ทางสถิตินี้ไม่เพียงช่วยให้สามารถทดสอบข้อสันนิษฐานของการมีอยู่ของความสัมพันธ์เชิงเส้นระหว่างคุณลักษณะต่างๆ เท่านั้น แต่ยังรวมถึงการสร้างความแข็งแกร่งด้วย
ประเภทของสัมประสิทธิ์สหสัมพันธ์
ค่าสัมประสิทธิ์สหสัมพันธ์สามารถจำแนกตามเครื่องหมายและค่า:
- เชิงบวก;
- โมฆะ;
- เชิงลบ.
ขึ้นอยู่กับค่าที่วิเคราะห์ ค่าสัมประสิทธิ์จะถูกคำนวณ:
- เพียร์สัน ;
- สเปียร์แมน;
- เคนดาลา ;
- สัญญาณ Fechner;
- ความสอดคล้องหรือความสัมพันธ์หลายอันดับ
ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันใช้เพื่อสร้างการเชื่อมโยงโดยตรงระหว่างค่าสัมบูรณ์ของตัวแปร ในกรณีนี้ การแจกแจงของตัวแปรทั้งสองชุดควรเข้าใกล้ค่าปกติ ตัวแปรที่เปรียบเทียบควรแตกต่างกันตามคุณสมบัติที่แตกต่างกันในจำนวนที่เท่ากัน สเกลที่แสดงตัวแปรต้องเป็นสเกลช่วงเวลาหรือสเกลอัตราส่วน
- การสร้างความแข็งแกร่งของความสัมพันธ์อย่างแม่นยำ
- การเปรียบเทียบลักษณะเชิงปริมาณ
การใช้สัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สันมีข้อเสียเล็กน้อย:
- วิธีการนี้ไม่เสถียรในกรณีที่มีค่าผิดปกติของค่าตัวเลข
- ใช้วิธีนี้ เป็นไปได้ที่จะกำหนดความแข็งแกร่งของความสัมพันธ์สำหรับความสัมพันธ์เชิงเส้นเท่านั้น สำหรับความสัมพันธ์ร่วมกันของตัวแปรประเภทอื่น ๆ ควรใช้วิธีการวิเคราะห์การถดถอย
ความสัมพันธ์อันดับถูกกำหนดโดยวิธีสเปียร์แมน ซึ่งทำให้สามารถศึกษาความสัมพันธ์ระหว่างปรากฏการณ์ทางสถิติได้ ด้วยค่าสัมประสิทธิ์นี้ จึงมีการคำนวณระดับความขนานที่แท้จริงของชุดคุณสมบัติที่แสดงเชิงปริมาณทั้งสองชุด และความใกล้ชิดของความสัมพันธ์ที่ระบุจะถูกประเมินด้วย
- ไม่ต้องการคำจำกัดความที่แน่นอนของค่าของความสัมพันธ์
- ตัวบ่งชี้เปรียบเทียบมีทั้งค่าเชิงปริมาณและค่าแอตทริบิวต์
- การเปรียบเทียบแถวของคุณสมบัติกับตัวแปรของค่าแบบเปิด
วิธีการของสเปียร์แมนหมายถึงวิธีการวิเคราะห์แบบไม่มีพารามิเตอร์ ดังนั้นจึงไม่จำเป็นต้องตรวจสอบความเป็นปกติของการกระจายคุณลักษณะ นอกจากนี้ยังช่วยให้คุณเปรียบเทียบตัวบ่งชี้ที่แสดงในระดับต่างๆ ตัวอย่างเช่น การเปรียบเทียบค่าของจำนวนเม็ดเลือดแดงในปริมาตรเลือดที่แน่นอน (มาตราส่วนต่อเนื่อง) กับการประเมินของผู้เชี่ยวชาญซึ่งแสดงเป็นคะแนน
ประสิทธิภาพของวิธีการได้รับผลกระทบทางลบจากความแตกต่างอย่างมากระหว่างค่าของค่าที่เปรียบเทียบ วิธีการนี้ยังใช้ไม่ได้ผลในกรณีที่ค่าที่วัดได้มีลักษณะการกระจายค่าที่ไม่สม่ำเสมอ
การคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ทีละขั้นตอนใน Excel
การคำนวณค่าสัมประสิทธิ์สหสัมพันธ์เกี่ยวข้องกับการดำเนินการทางคณิตศาสตร์จำนวนหนึ่งตามลำดับ
สูตรข้างต้นสำหรับการคำนวณค่าสัมประสิทธิ์เพียร์สันแสดงให้เห็นว่ากระบวนการนี้ลำบากเพียงใดหากทำด้วยตนเอง
การใช้ความสามารถของ Excel ช่วยเร่งกระบวนการค้นหาค่าสัมประสิทธิ์ในบางครั้ง
ก็เพียงพอแล้วที่จะปฏิบัติตามอัลกอริทึมของการกระทำอย่างง่าย:
- การแนะนำข้อมูลพื้นฐาน - คอลัมน์ของค่า x และคอลัมน์ของค่า y
- ในเครื่องมือ แท็บสูตรจะถูกเลือกและเปิดขึ้น
- ในแท็บที่เปิดขึ้น เลือก "แทรกฟังก์ชัน fx";
- ในกล่องโต้ตอบที่เปิดขึ้นจะมีการเลือกฟังก์ชันทางสถิติ "Correl" ซึ่งช่วยให้คุณสามารถคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ระหว่าง 2 อาร์เรย์ข้อมูล
- มีการป้อนข้อมูลในหน้าต่างที่เปิดขึ้น: อาร์เรย์ 1 - ช่วงของค่าของคอลัมน์ x (ต้องเลือกข้อมูล), อาร์เรย์ 2 - ช่วงของค่าของคอลัมน์ y;
- กดปุ่ม "ตกลง" ผลลัพธ์ของการคำนวณค่าสัมประสิทธิ์จะปรากฏในบรรทัด "ค่า"
- ข้อสรุปเกี่ยวกับการมีความสัมพันธ์ระหว่างชุดข้อมูล 2 ชุดและความแข็งแกร่ง
แบบจำลองสหสัมพันธ์ (CM) คือโปรแกรมการคำนวณที่ให้สมการทางคณิตศาสตร์ซึ่งตัวบ่งชี้ผลลัพธ์จะถูกวัดปริมาณโดยขึ้นอยู่กับตัวบ่งชี้หนึ่งตัวหรือมากกว่า
yx \u003d อ่าว + a1x1
โดยที่: y - ตัวบ่งชี้ประสิทธิภาพขึ้นอยู่กับปัจจัย x;
x - เครื่องหมายปัจจัย;
a1 - พารามิเตอร์ KM แสดงจำนวนตัวบ่งชี้ที่มีผล y จะเปลี่ยนไปเมื่อปัจจัย x เปลี่ยนไปหนึ่งหากปัจจัยอื่น ๆ ทั้งหมดที่ส่งผลต่อ y ยังคงไม่เปลี่ยนแปลงในเวลาเดียวกัน
ao - พารามิเตอร์ KM ซึ่งแสดงอิทธิพลของปัจจัยอื่น ๆ ทั้งหมดในตัวบ่งชี้ที่มีประสิทธิภาพ y ยกเว้นเครื่องหมายปัจจัย x
เมื่อเลือกตัวบ่งชี้ที่มีประสิทธิภาพและปัจจัยของแบบจำลอง จำเป็นต้องคำนึงถึงความจริงที่ว่าตัวบ่งชี้ที่มีประสิทธิภาพในสายโซ่ของความสัมพันธ์ระหว่างเหตุและผลนั้นอยู่ในระดับที่สูงกว่าตัวบ่งชี้ปัจจัย
ลักษณะของรูปแบบความสัมพันธ์
หลังจากคำนวณพารามิเตอร์ของโมเดลความสัมพันธ์แล้ว จะมีการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์
p - ค่าสัมประสิทธิ์สหสัมพันธ์คู่ -1 ≤ p ≤ 1 แสดงความแข็งแกร่งและทิศทางของอิทธิพลของตัวบ่งชี้ปัจจัยที่มีต่อปัจจัยที่มีประสิทธิภาพ ยิ่งใกล้ 1 ความสัมพันธ์ยิ่งแน่นแฟ้น ยิ่งเข้าใกล้ 0 ความสัมพันธ์ยิ่งอ่อนแอ ถ้าค่าสัมประสิทธิ์สหสัมพันธ์เป็นบวก แสดงว่าสัมพันธ์กันโดยตรง ถ้าเป็นลบ แสดงว่าสัมพันธ์กลับกัน
สูตรค่าสัมประสิทธิ์สหสัมพันธ์: pxy \u003d (xy-x * 1 / y) / eh * eu
อดีต=xx2-(x)2 ; eu=y2-(y)2
ถ้า CM เป็น multifactorial เชิงเส้น มีรูปแบบ:
yx \u003d ao + a1x1 + a2x2 + ... + axp
จากนั้นจึงคำนวณค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณ
0 ≤ Р ≤ 1 และแสดงความแข็งแกร่งของอิทธิพลของตัวบ่งชี้ปัจจัยทั้งหมดที่นำมารวมกันในตัวบ่งชี้ที่มีประสิทธิภาพ
P \u003d 1- ((uh-uy) 2 / (yi - usr) 2)
ที่ไหน: เอ่อ - ตัวบ่งชี้ที่มีประสิทธิภาพ - ค่าที่คำนวณได้;
ui - ค่าจริง;
usr - มูลค่าจริง, ค่าเฉลี่ย
ค่าที่คำนวณได้ yx ได้มาจากการแทนที่ในรูปแบบสหสัมพันธ์แทน x1, x2 เป็นต้น ค่าที่แท้จริงของพวกเขา
สำหรับแบบจำลองเชิงเส้นแบบปัจจัยเดียวและหลายปัจจัย อัตราส่วนสหสัมพันธ์จะถูกคำนวณ:
1 ≤ ม. ≤ 1;
เป็นที่เชื่อกันว่าความสัมพันธ์ระหว่างตัวบ่งชี้ที่มีประสิทธิภาพและปัจจัยที่รวมอยู่ในแบบจำลองนั้นอ่อนแอหากค่าของค่าสัมประสิทธิ์ความใกล้ชิดของการเชื่อมต่อ (m) อยู่ภายใน 0-0.3; ถ้า 0.3-0.7 - ความแน่นของการเชื่อมต่อเป็นค่าเฉลี่ย สูงกว่า 0.7-1 - การเชื่อมต่อนั้นแข็งแกร่ง
เนื่องจากค่าสัมประสิทธิ์สหสัมพันธ์ (คู่) p, ค่าสัมประสิทธิ์สหสัมพันธ์ (หลายค่า) P, อัตราส่วนสหสัมพันธ์ m เป็นค่าความน่าจะเป็น จากนั้นจึงคำนวณค่าสัมประสิทธิ์นัยสำคัญ (พิจารณาจากตาราง) หากค่าสัมประสิทธิ์เหล่านี้มากกว่าค่าแบบตาราง ค่าสัมประสิทธิ์ของความใกล้ชิดของการเชื่อมต่อจะเป็นเหตุผลสำคัญ หากค่าสัมประสิทธิ์นัยสำคัญของความหนาแน่นของการเชื่อมต่อน้อยกว่าค่าแบบตารางหรือหากค่าสัมประสิทธิ์การเชื่อมต่อน้อยกว่า 0.7 แสดงว่าไม่ใช่ตัวบ่งชี้ปัจจัยทั้งหมดที่ส่งผลต่อผลลัพธ์อย่างมีนัยสำคัญจะรวมอยู่ในแบบจำลอง
ค่าสัมประสิทธิ์ของการกำหนดแสดงให้เห็นอย่างชัดเจนถึงเปอร์เซ็นต์ของตัวบ่งชี้ปัจจัยที่รวมอยู่ในแบบจำลองที่กำหนดการก่อตัวของผลลัพธ์
หากค่าสัมประสิทธิ์ของการกำหนดมากกว่า 50 แบบจำลองจะอธิบายกระบวนการภายใต้การศึกษาอย่างเพียงพอ หากมีค่าน้อยกว่า 50 จำเป็นต้องกลับไปที่ขั้นตอนแรกของการก่อสร้างและแก้ไขการเลือกตัวบ่งชี้ปัจจัยเพื่อรวมไว้ใน แบบอย่าง.
ค่าสัมประสิทธิ์ของฟิชเชอร์หรือเกณฑ์ของฟิชเชอร์แสดงถึงประสิทธิภาพของแบบจำลองโดยรวม หากค่าสัมประสิทธิ์ที่คำนวณได้มีค่าเกินกว่าค่าตาราง แบบจำลองที่สร้างขึ้นจะเหมาะสำหรับการวิเคราะห์ เช่นเดียวกับตัวบ่งชี้การวางแผน การคำนวณสำหรับอนาคต ค่าตารางโดยประมาณ \u003d 1.5 หากค่าที่คำนวณได้น้อยกว่าค่าตาราง จำเป็นต้องสร้างแบบจำลองก่อน รวมถึงปัจจัยที่ส่งผลต่อผลลัพธ์อย่างมาก นอกเหนือจากประสิทธิภาพของแบบจำลองโดยรวมแล้ว ค่าสัมประสิทธิ์การถดถอยแต่ละค่ายังส่งผลต่อความสำคัญ หากค่าที่คำนวณได้ของค่าสัมประสิทธิ์นี้เกินค่าตาราง ค่าสัมประสิทธิ์การถดถอยจะมีนัยสำคัญ หากมีค่าน้อยกว่า ตัวบ่งชี้ปัจจัยที่คำนวณค่าสัมประสิทธิ์นี้จะถูกลบออกจากตัวอย่าง การคำนวณจะเริ่มต้นใหม่ แต่ไม่มีปัจจัยนี้ .
ค่าสัมประสิทธิ์สหสัมพันธ์คือระดับความสัมพันธ์ระหว่างตัวแปรสองตัว การคำนวณทำให้ทราบว่ามีความสัมพันธ์ระหว่างชุดข้อมูลสองชุดหรือไม่ ความสัมพันธ์ไม่อนุญาตให้มีการทำนายซึ่งแตกต่างจากการถดถอย อย่างไรก็ตาม การคำนวณค่าสัมประสิทธิ์เป็นขั้นตอนสำคัญในการวิเคราะห์ทางสถิติเบื้องต้น ตัวอย่างเช่น เราพบว่าค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างระดับการลงทุนโดยตรงจากต่างประเทศและการเติบโตของ GDP นั้นอยู่ในระดับสูง สิ่งนี้ทำให้เรามีความคิดที่ว่าเพื่อรับประกันความเจริญรุ่งเรือง จำเป็นต้องสร้างบรรยากาศที่เอื้ออำนวยต่อผู้ประกอบการต่างชาติโดยเฉพาะ ไม่ใช่ข้อสรุปที่ชัดเจนในแวบแรก!
ความสัมพันธ์และความเป็นเหตุเป็นผล
บางทีอาจไม่มีสถิติด้านเดียวที่จะมั่นคงในชีวิตของเรา ค่าสัมประสิทธิ์สหสัมพันธ์ถูกนำมาใช้ในทุกพื้นที่ของความรู้สาธารณะ อันตรายหลักของมันอยู่ที่ความจริงที่ว่าบ่อยครั้งที่ค่าที่สูงของมันถูกคาดเดาเพื่อโน้มน้าวใจผู้คนและทำให้พวกเขาเชื่อในข้อสรุปบางอย่าง อย่างไรก็ตาม ในความเป็นจริงแล้ว ความสัมพันธ์ที่แน่นแฟ้นไม่ได้บ่งบอกถึงความสัมพันธ์เชิงสาเหตุระหว่างปริมาณเลย
ค่าสัมประสิทธิ์สหสัมพันธ์: สูตรเพียร์สันและสเปียร์แมน
มีตัวบ่งชี้หลักหลายตัวที่แสดงความสัมพันธ์ระหว่างตัวแปรสองตัว ในอดีต ค่าแรกคือค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สัน มันผ่านไปแล้วที่โรงเรียน ได้รับการพัฒนาโดย K. Pearson และ J. Yule ตามผลงานของ Fr. กัลตัน. ค่าสัมประสิทธิ์นี้ช่วยให้คุณเห็นความสัมพันธ์ระหว่างจำนวนตรรกยะที่เปลี่ยนแปลงอย่างมีเหตุผล มันมีค่ามากกว่า -1 และน้อยกว่า 1 เสมอ จำนวนลบบ่งชี้ความสัมพันธ์แบบสัดส่วนผกผัน ถ้าค่าสัมประสิทธิ์เป็นศูนย์ แสดงว่าไม่มีความสัมพันธ์ระหว่างตัวแปร เท่ากับจำนวนบวก - มีความสัมพันธ์โดยตรงระหว่างปริมาณที่ศึกษา ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของสเปียร์แมนทำให้การคำนวณง่ายขึ้นโดยการสร้างลำดับชั้นของค่าตัวแปร
ความสัมพันธ์ระหว่างตัวแปร
ความสัมพันธ์ช่วยตอบคำถามสองข้อ ประการแรก ความสัมพันธ์ระหว่างตัวแปรเป็นบวกหรือลบ ประการที่สองการเสพติดนั้นรุนแรงเพียงใด การวิเคราะห์ความสัมพันธ์เป็นเครื่องมือที่มีประสิทธิภาพในการรับข้อมูลที่สำคัญนี้ เห็นได้ง่ายว่ารายได้และค่าใช้จ่ายในครัวเรือนเพิ่มขึ้นและลดลงตามสัดส่วน ความสัมพันธ์ดังกล่าวถือเป็นเชิงบวก ตรงกันข้าม เมื่อราคาสินค้าสูงขึ้น ความต้องการซื้อก็ลดลง ความสัมพันธ์ดังกล่าวเรียกว่าเชิงลบ ค่าของสัมประสิทธิ์สหสัมพันธ์อยู่ระหว่าง -1 ถึง 1 ศูนย์หมายความว่าไม่มีความสัมพันธ์ระหว่างค่าที่ศึกษา ยิ่งตัวบ่งชี้เข้าใกล้ค่ามากเท่าไร ความสัมพันธ์ก็จะยิ่งแข็งแกร่งขึ้นเท่านั้น (ลบหรือบวก) การขาดการพึ่งพาเป็นหลักฐานโดยค่าสัมประสิทธิ์ตั้งแต่ -0.1 ถึง 0.1 ต้องเข้าใจว่าค่าดังกล่าวบ่งชี้ว่าไม่มีความสัมพันธ์เชิงเส้นเท่านั้น
คุณสมบัติการใช้งาน
การใช้ตัวบ่งชี้ทั้งสองขึ้นอยู่กับสมมติฐานบางประการ ประการแรก การมีความสัมพันธ์ที่แน่นแฟ้นไม่ได้กำหนดความจริงที่ว่าค่าหนึ่งจะกำหนดอีกค่าหนึ่ง อาจมีปริมาณที่สามที่กำหนดแต่ละปริมาณ ประการที่สอง ค่าสัมประสิทธิ์สหสัมพันธ์เพียร์สันสูงไม่ได้บ่งชี้ถึงความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรที่ศึกษา ประการที่สาม มันแสดงความสัมพันธ์เชิงเส้นโดยเฉพาะ สามารถใช้ความสัมพันธ์เพื่อประเมินข้อมูลเชิงปริมาณที่มีความหมาย (เช่น ความกดอากาศ อุณหภูมิอากาศ) แทนที่จะเป็นหมวดหมู่ เช่น เพศหรือสีโปรด
ค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณ
Pearson และ Spearman ตรวจสอบความสัมพันธ์ระหว่างตัวแปรสองตัว แต่จะทำอย่างไรถ้ามีสามหรือมากกว่านั้น นี่คือที่มาของค่าสัมประสิทธิ์สหสัมพันธ์พหุคูณ ตัวอย่างเช่น ผลิตภัณฑ์มวลรวมประชาชาติไม่เพียงได้รับผลกระทบจากการลงทุนโดยตรงจากต่างประเทศเท่านั้น แต่ยังได้รับผลกระทบจากนโยบายการเงินและการคลังของรัฐ ตลอดจนระดับการส่งออกด้วย อัตราการเติบโตและปริมาณของ GDP เป็นผลมาจากการทำงานร่วมกันของปัจจัยหลายประการ อย่างไรก็ตาม ควรเข้าใจว่าโมเดลความสัมพันธ์พหุสัมพันธ์ขึ้นอยู่กับการทำให้เข้าใจง่ายและสมมติฐานหลายประการ ประการแรก ไม่รวมความเป็นหลายกลุ่มเชิงเส้นระหว่างปริมาณ ประการที่สอง ความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรที่ส่งผลต่อตัวแปรนั้นถือว่าเป็นแบบเส้นตรง
ขอบเขตของการใช้ความสัมพันธ์และการวิเคราะห์การถดถอย
วิธีการหาความสัมพันธ์ระหว่างปริมาณนี้ใช้กันอย่างแพร่หลายในทางสถิติ มักใช้ในสามกรณีหลัก:
- สำหรับการทดสอบความสัมพันธ์เชิงสาเหตุระหว่างค่าของตัวแปรสองตัว เป็นผลให้ผู้วิจัยหวังว่าจะพบความสัมพันธ์เชิงเส้นและได้รับสูตรที่อธิบายความสัมพันธ์เหล่านี้ระหว่างปริมาณ หน่วยการวัดของพวกเขาอาจแตกต่างกัน
- เพื่อตรวจสอบความสัมพันธ์ระหว่างค่าต่างๆ ในกรณีนี้ ไม่มีใครกำหนดว่าตัวแปรใดขึ้นอยู่กับ อาจกลายเป็นว่าค่าของทั้งสองปริมาณเป็นตัวกำหนดปัจจัยอื่น
- เพื่อให้ได้สมการ ในกรณีนี้ คุณสามารถแทนตัวเลขลงไปและค้นหาค่าของตัวแปรที่ไม่รู้จักได้
ผู้ชายที่ค้นหาความสัมพันธ์เชิงสาเหตุ
มีสติสัมปชัญญะเรียงตัวเป็นแน่แท้ต้องอธิบายเหตุการที่เกิดขึ้นรอบๆ คนมักจะมองหาความเชื่อมโยงระหว่างภาพของโลกที่เขาอาศัยอยู่กับข้อมูลที่เขาได้รับ บ่อยครั้งที่สมองสร้างระเบียบจากความโกลาหล เขาสามารถเห็นความสัมพันธ์เชิงสาเหตุได้อย่างง่ายดายซึ่งไม่มี นักวิทยาศาสตร์ต้องเรียนรู้เป็นพิเศษเพื่อเอาชนะแนวโน้มนี้ ความสามารถในการประเมินความสัมพันธ์ระหว่างข้อมูลเป็นสิ่งจำเป็นอย่างยิ่งในอาชีพทางวิชาการ
อคติของสื่อ
พิจารณาว่าการมีอยู่ของความสัมพันธ์สามารถตีความผิดได้อย่างไร นักเรียนอังกฤษกลุ่มหนึ่งถูกถามว่าพ่อแม่ของพวกเขาสูบบุหรี่หรือไม่ จากนั้นการทดสอบก็ตีพิมพ์ในหนังสือพิมพ์ ผลการวิจัยแสดงให้เห็นความสัมพันธ์อย่างมากระหว่างการสูบบุหรี่ของผู้ปกครองกับการกระทำผิดของเด็ก อาจารย์ที่ทำการศึกษานี้แนะนำให้ติดคำเตือนเกี่ยวกับซองบุหรี่ด้วย อย่างไรก็ตาม มีปัญหาหลายประการเกี่ยวกับข้อสรุปนี้ ประการแรก ความสัมพันธ์ไม่ได้ระบุว่าปริมาณใดเป็นอิสระจากกัน ดังนั้นจึงค่อนข้างเป็นไปได้ที่จะสันนิษฐานว่านิสัยที่เป็นอันตรายของผู้ปกครองเกิดจากการไม่เชื่อฟังของเด็ก ประการที่สอง เป็นไปไม่ได้ที่จะพูดด้วยความมั่นใจว่าปัญหาทั้งสองไม่ได้เกิดขึ้นเนื่องจากปัจจัยที่สาม เช่น ครอบครัวที่มีรายได้น้อย ควรสังเกตลักษณะทางอารมณ์ของข้อสรุปเบื้องต้นของอาจารย์ผู้ดำเนินการศึกษา เขาเป็นศัตรูตัวฉกาจของการสูบบุหรี่ ดังนั้นจึงไม่น่าแปลกใจที่เขาตีความผลการศึกษาของเขาในลักษณะนี้
ข้อสรุป
การตีความความสัมพันธ์แบบผิดๆ เป็นความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรสองตัวอาจนำไปสู่ข้อผิดพลาดในการวิจัยที่น่าอับอาย ปัญหาคือมันอยู่ที่แก่นแท้ของจิตสำนึกของมนุษย์ เทคนิคทางการตลาดมากมายใช้คุณสมบัตินี้ การเข้าใจความแตกต่างระหว่างสาเหตุและความสัมพันธ์ช่วยให้คุณวิเคราะห์ข้อมูลอย่างมีเหตุผลทั้งในชีวิตประจำวันและในอาชีพการงานของคุณ