ضریب همبستگی چه اطلاعاتی به ما می دهد و چه اطلاعاتی به ما نمی دهد

ضریب همبستگی هایی مانند پیرسون آماره های بسیار قدرتمندی هستند. آن ها ما را قادر می سازند تا به وجود و عدم وجود و همچنین قوت ارتباط بین دو متغیر مختلف پی ببریم. این اطلاعات می توانند بسیار مفید باشند اما افراد، از جمله دانشمندان علوم اجتماعی اغلب تفسیر بیش از آنچه باید، از ضریب همبستگی به دست می آورند. درواقع، مردم اغلب مفهوم همبستگی را با مفهوم علیّت اشتباه می گیرند. همبستگی به این معنی است که تغییر نمرات در یک متغیر با تغییر نمرات در متغیر دیگر ارتباط دارد. اما علیّت به این مفهوم است که تغییر در یک متغیر علت یا سبب تغییر نمرات در متغیر دوم است.

بنابراین جابه جایی مفهوم همبستگی با علیّت ما را به اشتباه می اندازد. برای روشن تر شدن مطلب، به این مثال داستانی که در زمان دانشجویی در کلاس روان شناسی شنیدم توجه کنید. در فصل زمستان، مدت کوتاهی بعد از جنگ جهانی دوم، ناگهان تعداد لک لک هایی که در یکی از کشورهای اروپای شمالی آشیانه کرده بودند، زیاد شد. تقریبا 9 ماه پس از آن، تعداد نوزادان نیز به طور چشم گیری افزایش پیدا کرد. رابطه بین لک لک ها و نوزاد ها هرچه باشد، بسیاری از مردم به این نتیجه رسیدند که ارتباط بین تعداد لک لک ها و تعداد نوزادها رابطه ای سببی بوده است. خوشبختانه علم ثابت کرده است که نوزادها، حداقل نوزادهای انسان، توسط لک لک ها به وجود نمی آیند. با این حال، لک لک ها و نوزادها بین خود یک چیز مشترک دارند. هردو آن ها به وسیله ی دمای سرد و شومینه گرم (دعوت) می شوند. ظاهرا لک لک ها به آشیانه سازی در دودکش های گرم خانه ها در فصل سرد زمستان علاقه مند هستند. از سوی دیگر، شب های سرد زمستان و اتاق خواب گرم و شومینه دار رفتار بچه آوردن بین زوجین را تقویت می کند. در نتیجه، رابطه به ظاهر علت و معلول بین لک لک و نوزادها به وسیله متغیر سومی ایجاد شده است: زمستان سرد.



 


نکته قابل ذکر در این مثال ها بسیار ساده است: وجود رابطه بین دو متغیر (یعنی همبستگی) ضرورتا به معنی وجود رابطه سببی (علت و معلولی) بین آن دو متغیر نیست. با وجود این، باید توجه داشت که وجود رابطه سببی بین دو متغیر لزوما نیازمند عنصر همبستگی بین آن دو متغیر است. به عبارت دیگر، من نمی توانم ادعا کنم که متغیری باعث به وجود آمدن متغیر دیگر می شود ( برای مثال، سیگار کشیدن سبب بروز سرطان می شود) بدون آنکه رابطه همبستگی بین آن دو متغیر وجود داشته باشد. چنان چه بین سیگار کشیدن و سرطان رابطه ای پیدا کنم، باید پیش از اظهار این نتیجه که سیگار کشیدن باعث سرطان می شود از نبود عوامل احتمالی دیگر مطمئن شوم.

علاوه بر موضوع علیّت، ویژگی های دیگری نیز در این رابطه وجود دارند که در خور توجه هستند. نکته اول این که، از همبستگی پیرسون برای بررسی رابطه خطی بین متغیر ها استفاده می شود. به عبارت دیگر، این نوع همبستگی متوسط رابطه مستقیم بین متغیر ها را توصیف می کند. برای مثال، اگر در بررسی خود بین دو متغیر به همبستگی مثبت دست یافتید، می توانید میزان افزایش مقادیر در یک متغیر را بنابر میزان افزایش نمرات در متغیر دیگر پیش بینی کنید اما همه همبستگی ها به صورت خطی نیستند. برای مثال بین اضطراب و عملکرد تحصیلی رابطه ای غیر خطی وجود دارد. برای مثال، کمی اضطراب هنگام امتحان ریاضی می تواند مفید باشد. اما اگر این اضطراب بیش از اندازه افزایش پیدا کند، بر عملکرد دانشجو تاثیر منفی خواهد داشت. این رابطه غیر خطی نامیده می شود زیرا آنچه به منزله رابطه مثبت بین اضطراب کم و عملکرد تحصیلی شروع شد با افزایش میزان اضطراب به رابطه ای منفی گرایش پیدا می کند. از آن جا که ضریب همبستگی نشان دهنده ی رابطه متوسط بین دو متغیر است، زمانی که رابطه بین دو متغیر غیر خطی باشد، ضریب همبستگی ممکن است کاملا کوچک باشد که نشان دهنده ی این حقیقت است که ممکن است رابطه ای ضعیف تر وجود داشته باشد.

نتیجه:
ضریب همبستگی پیرسون وجود رابطه بین دو متغیر را نشان می دهد و رابطه باید خطی باشد.
اما وجود همبستگی، به معنای علیّت نیست و ضریب همبستگی پیرسون نمی تواند روابط غیرخطی را محاسبه کند.

 

** گردآوری: مرکز آماری خوارزمی (منبع: کتاب آمار به زبان ساده، ترجمه عبدالوهاب خادمی شمامی)