انواع روش های همبستگی Correlation


همانگونه که مشاهده می‌کنید ماتریس همبستگی برای این دو متغیر ارایه شده است. با توجه به شکل فوق، میزان r همبستگی بین دو متغیر امید و خوش‌بینی برابر با ۰/۷۵ به دست آمده که این مقدار با توجه سطح آماری معنادار نیز می‌باشد (۰/۰۰۱=p). از آن جهت بالای عدد ۰/۷۵ دو ستاره آمده است که این مقدار در سطح آماری ۰/۰۱ معنادار شده است. اگر در سطح ۰/۰۵ معنادار می‌شد فقط یک ستاره بالای آن نمایان می‌گردید (p-Value در تحلیل آماری چه اطلاعاتی به شما می دهد؟). برای گزارش جدول فوق در پایان نامه یا مقاله جدول زیر را پیشنهاد می‌کنیم:

نحوه انجام تحلیل همبستگی پیرسون در spss

یکی دیگر از تحلیل‌های آماری بسیار مهم نرم افزار spss تحلیل همبستگی پیرسون می‌باشد. تحلیل همبستگی پیرسون جهت بررسی ارتباط دو متغیر با مقیاس فاصله‌ای استفاده می‌شود و در علوم انسانی و پزشکی کاربرد بسیار زیادی دارد. تحلیل همبستگی پیرسون را می‌توان پیشامد برخی تحلیل‌های دیگر مانند تحلیل رگرسیون محسوب نمود زیرا قبل از انجام تحلیل رگرسیون انواع روش های همبستگی Correlation معمولاً ماتریس همبستگی بین متغیرها محاسبه می‌شود تا مشخص گردد آیا بین متغیرها اصلاً رابطه‌ای وجود دارد یا خیر. بعد از مشخص شدن رابطه بین متغیرهاست که انجام تحلیل رگرسیون برای پیش‌بینی معنی پیدا می‌کند. در زیر قصد آن داریم تا به صورت کامل و مرحله به مرحله نحوه انجام تحلیل همبستگی پیرسون در spss را ذکر کنیم.

کار را با ذکر مثالی شروع می‌کنیم: محققی قصد دارد به بررسی رابطه همبستگی دو متغیر امیدواری و خوش بینی بر روی یک نمونه‌ای بپردازد.

مرحله اول: بعد از جمع‌آوری داده‌ها و وارد کردن آنها به نرم افزار spps کار تحلیل داده را اینگونه شروع کنید؛ به نرم افزار spss رفته و دستور زیرا اجرا کنید:

1

با اجرای دستور فوق پنجره‌ای به شکل زیر باز می‌شود. این پنجره دارای دو کادر می‌باشد که کادر سمت چپ را شمار ۱ و کادر سمت راست (Variable) را کادر شماره ۲ نامگذاری می‌کنیم.

نحوه انجام تحلیل همبستگی پیرسون در spss

نحوه انجام تحلیل همبستگی پیرسون در spss

مرحله دوم: متغیرهای مورد نظر خود را از کادر ۱ وارد کادر ۲ نمایید. اگر سوالات دو پرسشنامه را وارد نموده‌اید و نمی‌دانید چگونه نمره کل هریک از پرسشنامه‌ها را در spss چگونه محاسبه نمایید به یکی دیگر از آموزشهای ما که در این لینک آمده مراجعه نمایید. بعد از محاسبه نمره کل دو پرسشنامه صرفا نمرات کل را وارد کادر نمایید و در پایان از قسمت پایین کادر ۱ و ۲ آزمون پیرسون (Pearson) را انتخاب نمایید. سایر گزینه‌ها آزمون کندال و اسپیرمن هستند که آزمون‌‎های جداگانه‌ای می‌باشند و به تحلیل پیرسون ربطی ندارند. بعد از انجام عملیات فوق نهایتاً می‌بایست پنجره‌ای به شکل زیر پدید آید:

admin-ajax.php

نحوه انجام تحلیل همبستگی پیرسون در spss

بعد از پدیدار شدن این پنجره، دکمه OK را فشار دهید تا این تحلیل انجام شود. بعد از انجام این کار خروجی‌ها به شکل زیر ظاهر می‌شوند:

نحوه انجام تحلیل همبستگی پیرسون در spss

همانگونه که مشاهده می‌کنید ماتریس همبستگی برای این دو متغیر ارایه شده است. با توجه به شکل فوق، میزان r همبستگی بین دو متغیر امید و خوش‌بینی برابر با ۰/۷۵ به دست آمده که این مقدار با توجه سطح آماری معنادار نیز می‌باشد (۰/۰۰۱=p). از آن جهت بالای عدد ۰/۷۵ دو ستاره آمده است که این مقدار در سطح آماری ۰/۰۱ معنادار شده است. اگر در سطح ۰/۰۵ معنادار می‌شد فقط یک ستاره بالای آن نمایان می‌گردید (p-Value در تحلیل آماری چه اطلاعاتی به شما می دهد؟). برای گزارش جدول فوق در پایان نامه یا مقاله جدول زیر را پیشنهاد می‌کنیم:

نحوه انجام تحلیل همبستگی پیرسون در spss

اجرای آزمون همبستگی پیرسون در SPSS

احتمالا، گسترده­ ترین کاربرد شاخص آماری همبستگی دو متغیری، ضریب همبستگی گشتاوری پیرسون است که به ­طور معمول همبستگی پیرسون نامیده می­شود. علامت اختصاری آن r است. ضریب پیرسون نشان می­ دهد که تا چه اندازه بین متغیرهای کمّی رابطه انواع روش های همبستگی Correlation خطی وجود دارد(میزر، گامست و گارینو،152:1391).

کاربرد اصلیِ ضریب پیرسون زمانی است که متغیرها از نوع پارامتری باشند؛ بدین معنا که توزیع نرمال داشته باشند و در سطح فاصله­ ای/نسبی باشند. البته زمانی که متغیرها از نوع شبه فاصله ­ای باشند (یعنی هر متغیر ترکیبی از چند متغیر ترتیبی باشد که اصطلاحا به آن انواع روش های همبستگی Correlation مقیاس های تراکمی می­گویند)، برخی از پژوهش­گران از ضریب پیرسون استفاده می­کنند. برخی از نویسندگان استفاده از ضریب پیرسون برای یک متغیر دو ارزشی و یک متغیر فاصله­ ای/نسبی را هم مجاز شمرده ­اند. تفسیر همبستگی پیرسون زمانی که یکی از متغیرها دوارزشی (فقط شامل دو سطح) اما متغیر دیگر کمّی است نیز می­تواند منطقی باشد(میزر، گامست و گارینو،164:1391).

تفسیر شدّت رابطه در همبستگی پیرسون
بعد از تعیین معنی­ داری و جهت رابطه، باید شدّت رابطه ارزیابی شود. برای تفسیر شدّت رابطه دومتغیر، تقسیم ­بندی­ های گوناگونی ارائه شده­ است. تقسیم ­بندی زیر یکی­ از آن­ هاست.

شیوه تفسیر شدت رابطه در همبستگی پیرسون

شدّت رابطه تفسیر
8/. تا 1 رابطه بسیار قوی
6/. تا 8/. رابطه قوی
4/. تا 6/. رابطه متوسط
2/. تا 4/. رابطه کم (یا ضعیف)
صفر تا 2/. فقدان رابطه یا رابطه ناچیز

(منبع: میلر، 299:1380)

مثال

در این بخش به بررسی همبستگی بین دو متغیر بهره هوشی و معدل مقطع کارشناسی می ­پردازیم. انتظار داریم که دو متغیر با یکدیگر همبسته باشند، به نحوی که با افزایش بهره هوشی، معدل افزایش بیابد. به عبارت دیگر انتظار داریم افرادی که بهره هوشی بالاتری دارند، معدل بالاتری هم داشته باشند. هر دو متغیر کمّی بوده و در سطح سنجش فاصله ­ای/­نسبی قرار دارند. با توجه به این که هردو متغیر در سطح سنجش فاصله­ ای/نسبی هستند از ­همبستگی ­پیرسون استفاده می­کنیم. از پیش ­فرض ­های آزمون همبستگی پیرسون نرمال بودن توزیع متغیر در جمعیّت آماری است، در این مثال فرض می­ کنیم که این پیش­فرض برقرار است و توزیع داده­ ها نرمال است

اجـ ـرا

مسیر زیر را دنبال می­کنیم:

Analyze—>Correlate—>Bivariate

نتـ ـایج

در جدول بعد، نتایج آزمون همبستگی پیرسون بین دو متغیر بهره هوشی و معدل کارشناسی نشان داده­ شده ­است. نخست به سطح معنی ­داری به دست آمده نگاه می­کنیم. سطح معنی ­داری به دست آمده برابر با 600/. به دست آمده است که بسیار بیشتر از مقدار مفروض 05/.است. در نتیجه بین دو متغیر بهره هوشی و معدل مقطع ­کارشناسی پاسخگویان رابطه معنی داری وجود ندارد. با توجه به این که بین دو متغیر همبستگی وجود ندارد، شدّت و جهت رابطه مورد بررسی قرار نمی­ گیرد.

Correlations
بهره هوشی معدل کارشناسی
بهره هوشی Pearson Correlation 1 -.053
Sig. (2-tailed) .600
N 100 100
معدل کارشناسی Pearson Correlation
همبستگی پیرسون
-.053 1
Sig. (2-tailed) .600
N 100 100

گـ ـزارش:
در گزارش نتایج می­ نویسیم:
از آزمون همبستگی ­پیرسون جهت آزمون رابطه دو متغیر بهره هوشی و معدل مقطع کارشناسی استفاده شد. بین میزان بهره هوشی و معدل مقطع کارشناسی همبستگی معنی­ دار مشاهده نشد (600/. = P و 100= n و 053/.- = r ). در نتیجه از جنبه آماری دو متغیر بهره هوشی و معدل کارشناسی با یکدیگر رابطه ندارند.

***
(فرض می کنیم رابطه به دست آمده معنی ­دار باشد و سطح معنی­ داری به دست آمده برابر با 004/. شده است و ضریب پیرسون برابر با 45/. به دست آمده است. در این صورت به این صورت گزارش می­ دهیم:

آزمون همبستگی پیرسون نشان داد که بین میزان بهره هوشی و معدل مقطع کارشناسی همبستگی وجود دارد (004/. = P و 100= n و 45/. = r ). جهت رابطه بین بهره هوشی و معدل کارشناسی مثبت است. شدت همبستگی به­ دست آمده در حد متوسط است. واریانس توضیح داده شده 20.3% است. نتایج نشان می­ دهد دانشجویانی که بهره هوشی بالاتری دارند، معدل کارشناسی بالاتری هم کسب کرده­ اند.

چندنکته:
ضریب همبستگی پیرسون را با r نشان می­ دهند.
واریانس توضیح داده ­شده همان 2 r است که از به توان­ دو رساندن ضریب همبستگی پیرسون ( r ) به دست می ­آید و نشان­ دهنده واریانس مشترک دو متغیر است.
بهتر است نمودار پراکندگی دو متغیر بهره ­هوشی و معدل در گزارش ذکر شود (قبل از نتایج آزمون همبستگی پیرسون).

تحقیق روش تحقیق همبستگی

قدرت تصور در انسان يکی از ويژگيهای مهم می باشد اين قدرت به فرد امکان می دهد تا در مورد موضوعات مختلف بيانديشد، حدس بزند، تصوير ذهنی ايجاد کند و راه حل های مختلف پيشنهاد کند. در تحقيق به روش علمی که حول محور يک مسئله يا مشکل صورت می پذيرد، از اين انواع روش های همبستگی Correlation قدرت تصور و حدس ذهنی برای تدوين يک يا چند فرضيه برای نتيجه تحقيق استفاده می شود. از اين رو می توان فرضيه تحقيق را يک حدس علمی يا پيش داوری دانست که بوسيله ی جمع آوری حقايقی که منجر به قبولی يا رد آن فرضيه می شود مورد آزمايش قرار می گيرد. به عبارت دیگر فرضيه را راه حل پيشنهادی محقق برای مسئله تحقيق و يا نتيجه تحقيق دانسته اند.

گاهی اوقات از يک فرمول برای بيان فرضيه استفاده می شود، بدين شکل که:”اگر چنين و چنان رخ دهد چنين و چنان خواهد شد” . اين تعبير ساده و روان به محقق امکان می دهد تا بتواند در جريان تدوين مسئله تحقيق خود، فرضيه ای مناسب که به طور قطعی با کل پژوهش او در ارتباط خواهد بود، بيان نمايد. نکته با اهميت در اینجا آن است که محقق بايد دقت نمايد که در جريان انجام تحقيق ، او صرفا” قصد آزمايش فرضيه را دارد نه اثبات آن ، البته چنانچه در پايان تحقيق ،نتايج ، حاکی از اثبات فرضيه او بود می تواند آن موضوع به شکل يک بحث علمی مورد عنايت قرار دهد.

در هنگام بيان فرضيه محقق به بررسی روابط بين متغيرها می پردازد. به طور متداول اين بيان به سه شکل صورت خواهد گرفت:

  • بررسی رابطه علت و معلولی بين دو يا چند متغير
  • بررسی همبستگی و شدت آن بين دو يا چند متغير
  • بررسی و مقايسه ميزان تفاوت تاثير دو يا چند متغير بر يک يا چند متغير

محقق برای تهيه فرضيه مناسب تحقيق عمدتا از منابع علمی در اختيار خود کمک خواهد گرفت. يافته های علمی قبلی که در زمينه موضوع تحقيق انجام گرفته است يکی از منابع اصلی برای تهيه فرضيه است. همچنين تجربيات شخصی فرد محقق می تواند نقش مهمی را در اين زمينه ايفا نمايد. گاهی اوقات فرضيه هائی مبتنی بر خيال و با مطالب غير علمی، الهامات و پيشنهادات غير عادی هم مطرح می شود که در برخی موارد به نتايج خوبی نيز نائل گرديده است.

در این راستا، تحقیق همبستگی (Correlation) که خود زیر مجموعه تحقیقات توصیفی (غیر آزمایشی) است با این هدف انجام می‌شود که رابطه میان متغیرها (Variables) را نشان دهد. تحقیق همبستگی بر اساس هدف تحقیق به دسته کلی تقسیم می‌شود. دسته اول به تحقیقاتی مربوط می‌شود که هدف بررسی همبستگی دو متغیری است، بدین معنی که محقق می‌خواهد رابطه دو به دو متغیرهای موجود را بررسی کند.

دسته دوم تحقیقات مربوط به تحلیل رگرسیون (Regression Analysis) را شامل می‌شود که هدف آن پیش بینی تغییرات یک یا چند متغیر وابسته (ملاک) با توجه به متغیرهای مستقل (پیش بینی) است. و در نهایت دسته سوم مربوط به تحلیل ماتریس همبستگی (Correlafion Matrix Analysis) و آزمودن روابط ساختاری مبتنی بر نظریه ها انجام می‌گیرد. هر یک از این سه دسته تحقیق روش آماری خود را برای تجزیه و تحلیل لازم دارد که برخی از این روشها به دلیل پیچیدگی توسط کامپیوتر انجام می‌شود.

فصل دوم: انواع روشهای تحقیق و تحلیل

روش تحقیق همبستگی دو متغیری

در این نوع تحقیق همبستگی هدف تعیین میزان همبستگی تغییرات دو متغیر می‌باشد. در اکثر تحقیقات همبستگی دو متغیری از مقیاس فاصله‌ای با پیش فرض توزیع طبیعی دو متغیر در جامعه برای اندازه گیری استفاده می‌شود و معمولا برای تجزیه و تحلیل داده‌ها از فرمول ضریب همبستگی گشتاوری پیرسون (Pearson Product Moment Correlation Coefficient) استفاده می‌شود.

توجه:

برای دانلود فایل کامل ورد لطفا اقدام به خرید نمایید.

لینک دانلود فایل بلافاصله پس از خرید بصورت اتوماتیک برای شما ایمیل می گردد.

سفارش تحقیق

به منظور سفارش تحقیق مرتبط با رشته تخصصی خود بر روی کلید زیر کلیک نمایید.

ضریب همبستگی در بورس چه کاربردی دارد؟

ضریب همبستگی روابط میان دو متغیر را به ما نشان می‌دهد. یعنی با توجه به این ضریب می‌توانیم بفهمیم که آیا دو متغیر با هم ارتباط دارند یا نه. و اگر ارتباطی دارند جهت این ارتباط کدام طرفی است. از این ضریب در بازار بورس به منظور پیدا کردن روابط بین سهام استفاده می‌کنیم.

بارها توسط افراد مختلف در حوزه‌های شغلی گوناگون یا در رسانه‌ها به منظور تحلیل آماری و بیان نتایج تحقیقات، واژه ضریب همبستگی یا اصطلاح لاتین آن Correlation را شنیده‌ایم. یکی از مهم ترین کاربردهای این مفهوم در بازارهای مالی است، که در این مطلب به بررسی آن و مباحث پیرامونی در حوزه بازار بورس می‌پردازیم. ضریب همبستگی یک ابزار آماری برای تعیین نوع و درجه رابطه متغیرهای کمی با یکدیگر است. این انواع روش های همبستگی Correlation مفهوم یکی از معیارهای تشخیص میزان همبستگی دو متغیر می‌باشد. در واقع این ضریب نوع رابطه یعنی مستقیم یا معکوس بودن و شدت رابطه یعنی بازه ۱+ تا ۱- را نشان می‌دهد. همچنین اگر میان دو متغیر مذکور رابطه‌ای وجود نداشته باشد، مقدار ضریب همبستگی برابر صفر است.

انواع روابط بین متغیرها

الف ) رابطه مستقیم

اندازه عددی بدست آمده برای این ضریب بین 1- تا 1+ می باشد که به کمک آن می توان درجه ای را که دو متغیر بایکدیگر در ارتباط هستند را نشان داد. در صورتی که عدد همبستگی بین صفر تا 1 باشد نوع رابطه را مستقیم می نامیم.

رابطه مستقیم به این معنی است که با افزایش یک متغیر انتظار می رود که اندازه متغیر دیگر نیز افزایش یابد و برعکس با کاهش اندازه یک متغیر اندازه متغیر دیگر نیز کاهش یابد. به عنوان مثال وقتی گفته می شود بین مصرف میوه با شادابی پوست رابطه مستقیمی وجود دارد یعنی که اگر فردی مصرف میوه اش بیشتر باشد انتظار می رود که پوست شادابتری داشته باشد و یا اینکه افراد هر چقدر پوست شادابتری داشته باشند انتظار می رود که مصرف میوه آنها نیز بالاتر باشد و برعکس.

ب ) رابطه معکوس

در صورتی که عدد ضریب همبستگی بین صفر تا 1 – باشد رابطه را از نوع معکوس می نامیم. رابطه معکوس به این معنی است که با افزایش یک متغیر انتظار می رد که اندازه متغیر دیگر نیز کاهش یابد و برعکس با کاهش اندازه یک متغیر اندازه متغیر دیگر نیز افزایش یابد. به عنوان مثال وقتی گفته می شود بین مصرف سیگار با طول عمر رابطه معکوس وجود دارد یعنی که اگر فردی مصرف سیگارش بیشتر باشد انتظار می رود که طول عمر کمتری داشته باشد و یا اینکه افراد هر چقدر طول عمر بیشتری داشته باشند انتظار می رود که کمتر سیگار مصرف کرده باشند و برعکس.

علاوه بر این درصورتی که مقدار عددی همبستگی برابر 1+ باشد همبستگی را مستقیم کامل و اگر برابر 1 – باشد آن را معکوس کامل و در صورتی که برابر صفر باشد می گوییم بین دو متغیر هیچگونه رابطه ای وجود ندارد.

انواع روش های همبستگی Correlation

  • ضریب همبستگی پیرسون
  • ضریب همبستگی اسپیرمن
  • ضریب همبستگی تاو کندال

بطور کلی:
۱- اگر هر دو متغیر با مقیاس رتبه‌ای باشند از شاخص تاوکندال استفاده می‌شود.
۲- اگر هر دو متغیر با مقیاس نسبتی و پیوسته باشند از ضریب همبستگی پیرسون استفاده می‌شود.
۳- اگر هر دو متغیر با مقیاس نسبتی و گسسته باشند از ضریب همبستگی اسپیرمن استفاده می‌شود.

در پایین فقط ضریب همبستگی پیرسون را با هم بررسی می‌کنیم.

ضریب همبستگی پیرسون

ضریب همبستگی پیرسون را می‌توانیم معروف‌ترین انواع این ضریب بدانیم. وقتی تعداد داده‌ها زیاد است و توزیع‌ها هم نرمال هستند انواع روش های همبستگی Correlation بهتر است از ضریب پیرسون استفاده کنیم تا شدت و جهت روابط بین دو متغیر را بررسی کنیم. این ضریب مقدار وابستگی بین دو متغیر تصادفی را خیلی خوب به ما نشان می‌دهد.

در ابتدای مقاله فرمول مربوط به این ضریب را بررسی کردیم. وقتی داده‌ها را در فرمول جای‌‌گذاری کنیم، نتایج مختلفی به دست می‌آید. در تفسیر ضریب همبستگی پیرسون به طور کلی سه حالت زیر را داریم:

  • مثبت: اعداد مثبت نشان از رابطه‌ی مستقیم بین دو متغیر دارند. یعنی اگر مقدار یکی از متغیرها زیاد شود، مقدار متغیر دیگری هم زیاد می‌شود. در مورد کاهش مقدار هم این قضیه برقرار است. اگر نتیجه‌ی محاسبات اعدادی بین ۰.۸ تا ۱ باشند، در تفسیر ضریب همبستگی باید بگوییم که این دو متغیر رابطه‌ای بسیار قوی دارند. اعداد بین ۰.۸ تا ۰.۶ نشان از رابطه‌ای قوی دارند. هم‌چنین اعداد ۰.۶ تا ۰.۴ رابطه‌ای متوسط را نشان می‌دهند و مقادیر کمتر نشان از رابطه‌ی ضعیف دارد. اگر نتیجه در بازه‌ی ۰.۲ تا صفر قرار بگیرد رابطه بین دو متغیر یا خیلی ناچیز است یا اصلا رابطه‌ای وجود ندارد.
  • منفی: این نتیجه برعکس قبلی است. یعنی اگر ضریب همبستگی پیرسون بین دو متغیر منفی باشد، وقتی مقدار یک متغیر زیاد شود، مقدار متغیر دیگری کم می‌شود و بالعکس.
  • صفر: کاملا مشخص است که ضریب صفر به چه معناست. این عدد نشان می‌دهد که رابطه‌ای بین دو متغیر تصادفی وجود ندارد.

چه نکاتی در همبستگی دو نماد وجود دارد؟

دو نکته اصلی درباره همبستگی بین نمادها نهفته است که میتواند به تصمیم گیری بهتر به ما کند.

نکته اول: امکان ندارد که عمده پرتفوی بورسی یک شرکتی چندین روز مثبت باشد ولی خود آن سهم منفی باشد. اگر چنین شد، فرصت خوبی برای سرمایه گذاری ایجاد شده است و هر چقدر این اختلاف بیشتر شود سود بیشتری در انتظار خواهد بود. برای مثال اگر دیدید فملی چندین روز صف خرید است و وسپه در حال درجا زدن است، احتمالا وسپه گزینه خوبی برای خرید انواع روش های همبستگی Correlation است چرا که درصدی از فملی برای وسپه است و از رشد آن متنفع خواهد شد. این مسئله تحت عنوان NAV سهم در تحلیل بنیادی مورد بررسی قرار می‌گیرد.

نکته دوم: برخی نمادها به علت پرتفوی مشابه، رفتار قیمتی مشابهی دارند. این موضوع به یک سرمایه گذار حرفه ای کمک خواهد کرد که موقعیت‌های خوبی را شناسایی کند. برای مثال اگر در یک روز وسپه صف خرید بود و تاصیکو منفی، احتمالا می‌توانید تاصیکو را حداقل به دید کوتاه مدت خریداری کنید چرا که ضریب همبستگی بین این دو نماد بالاست.

مثالی از کاربرد ضریب همبستگی در ترکیب پرتفوی

این بخش را با یک مثال از کاربرد ضریب همبستگی در چیدمان سبد سهام ادامه می‌دهیم. دو شرکت الف و ب را در نظرتان مجسم کنید. حالا فرض کنید شرکت الف ۱۱۰ میلیون سهم شرکت ب را که در گروه خودروسازی فعال است خریداری کرده است. پس انتظار داریم وقتی در سهم ب اتفاقات مثبتی رخ بدهد، شاهد تعدیل مثبت در سهم الف باشیم. یعنی با افزایش قیمت سهم ب، سهم الف هم سودسازی خوبی را خواهد داشت. هر چه شرکت الف درصد مالکیت بالاتری داشته باشد، سودسازی‌اش هم بیشتر خواهد بود. اما این اطلاعات به چه دردی می‌خورند؟

قضیه خیلی ساده است. اگر سهم شرکت الف را خریده‌اید دیگر سهم شرکت ب را نخرید. درست است که این دو شرکت سهام متفاوتی دارند اما به هر حال با یک‌دیگر همبستگی دارند. این‌طور می‌توانید سبد سهامی بچینید که پوشش ریسک در آن رعایت شده است. این مسئله یکی از اصول اولیه برای متنوع سازی سبد سهام است. اگر به ترکیب سهامداران شرکت‌های فعال در بورس ایران نگاه کنید، می‌توانید ببینید عمده سهامداران شرکت‌ها چه کسانی هستند. به این انواع روش های همبستگی Correlation انواع روش های همبستگی Correlation ترتیب نه تنها ریسک را کم کرده‌اید بلکه ممکن است بازده بیشتری را هم به دست بیاورید.

تحلیل آماری چیست؟ همه چیز درباره انجام تحلیل آماری پایان نامه

علم آمار از گذشته تا کنون نقشی اساسی و مهم را در علوم مختلف داشته است که از اولین کاربردهای آن می ­توان به مالیات گیری و خراج بستن بر دارایی ها اشاره کرد.

بعدها در دوره رنسانس، از علم آمار استفاده­ نوینی صورت گرفت و به آمار استنباطی نیز توجه زیادی شد. در دنیای امروز علم آمار و آمارگیری بسیار پررونق است. اکثر دانش آموختگان حداقل یکبار مطلبی را در ارتباط با آمار خوانده اند و نیاز بوده تا با استفاده از روش­ های آمارگیری، تحلیل ­هایی انجام دهند.

این مساله اهمیت تحلیل آماری را نشان می­ دهد بنابراین نیاز است که به طور کامل بدانیم تحلیل آماری چیست و چگونه انجام می­ شود؟

تحلیل آماری چیست؟

اگر بخواهیم تحلیل آماری را دقیق ­تر توضیح دهیم باید ابتدا به تعریف واژه­ ی آمار بپردازیم.

آمار را علم طبقه بندی دیتاها و اطلاعات، علم تصمیم گیری­ های مبتنی بر منطق، برنامه ریزی ­های دقیق و علم توصیف و تبیین آنچه از مشاهدات می­ توان فهمید توصیف می­ کنند.

آمار را می ­توان علم و هنر جمع آوری و تجزیه و تحلیل داده ­ها دانست به طوری که در نهایت بتوان آنچه استخراج شده است را تفسیر و استنباط کرد.

امروزه به ندرت می­ توان بدون استفاده از تحلیل آماری اقدام به تفسیر و تحلیل نتایج به دست آمده از تحقیقات و پژوهش­ های علمی کرد.

به گزارشی که شامل جداول و نمودارهای آماری و تحلیل و تفسیر آن ­ها می­ شود تحلیل آماری گفته می­ شود.

تحلیل آماری تصویری روشن و توصیفی دقیق از داده ­ها ارائه می ­دهد. این داده­ ها ممکن است به صورت داده­ های آماری آماده باشند (مانند نرخ تورم، درآمد، و مانند آن) یا از طریق پرسشنامه ­ها جمع آوری شده باشند.

فرآیند تحلیل آماری را در دو بخش تقسیم می­کنند: آمار استنباطی و آمار توصیفی.

مبنا و پایه این تقسیم بندی به دو دسته استنباطی و توصیفی این است که بشر با توجه به محدودیت زمان و سایر امکانات تصمیم گرفت تا از استقراء استفاده کند. بر اساس استقراء می­ توان یافته ­هایی را که از «اجزا» به دست می آید را به «کل» نسبت داد.

این بدین معناست که یافته­ های مربوط به نمونه ­ها، در مورد کل جامعه که احتمالا به دلیل محدودیت­ ها و مشکلات دیگر قابل بررسی به صورت کلی نبوده اند، حکم می­ شود.

آمار توصیفی چیست؟

وقتی توده­ ای از اطلاعات برای تحقیق جمع آوری می­ شود باید ابتدا سازماندهی و خلاصه شود به طوری که به صورت معنی داری قابل درک و ارتباط باشند.

برای این منظور از روش آمار توصیفی (Descriptive Statistics) استفاده می­ شود.

در تجزیه و تحلیل توصیفی، پژوهشگر داده ­های جمع آوری شده را با کمک روش ­های آمار توصیفی از جمله تنظیم جداول توزیع فراوانی، خلاصه کرده و به کمک نمودار آن­ها را نمایش می ­دهد و در نهایت با کمک سایر شاخص ­های آمار توصیفی آن ها را خلاصه می ­کند.

روش ­های آمار توصیفی

تشکیل جدول توزیع فراوانی

به سازماندهی داده­ ها یا مشاهدات به صورت طبقات همراه با فراوانی هر طبقه، توزیع فراوانی گفته می­ شود.

برای اینکه یک جدول توزیع فراوانی داشته باشید باید دامنه تغییرات، تعداد طبقات و حجم طبقات توسط فرمول­ های مربوطه محاسبه شود و سپس جدول توزیع در دو ستون x (ستون طبقات) و F (فراوانی طبقات) تشکیل شود.

پس از این مرحله، در صورت تمایل یا لزوم، پژوهشگر می ­تواند شاخص ­های دیگری نظیر فراوانی تراکمی، فراوانی تراکمی درصدی را محاسبه کند.

تشکیل جدول توزیع فراوانی یک روش اقتصادی و آسان برای نمایش انبوهی از داده ­های نامنظم است. اما در طبقه بندی کردن، ممکن است برخی از اطلاعات به علت خطای گروه بندی از دست بروند که در نهایت در محاسبه شاخص ­های آماری نیز تاثیر بگذارند. ولی مقدار آن اغلب ناچیز است و اشکال عمده ­ای ایفا نمی­ کند.

ترسیم نمودار

نمودارها ابزار مناسبی برای نمایش تصویری اطلاعات هستند که انواع مختلفی دارند که از آن­ ها می­ توان به نمودار هیستوگرام، نمودار ستونی، نمودار چند ضلعی تراکمی، نمودار دایره ای، نموداری سری ­های زمانی و موارد دیگر اشاره کرد.

محاسبه شاخص ­های مرکزی

در محاسبات آماری لازم است که ویژگی­ ها و موقعیت کلی داده ­ها تعیین شود.

به همین دلیل شاخص­ های مرکزی که سه نوع نما(Mode)، میانه(Median) و میانگین (Mean) هستند محاسبه می­ شوند. هر یک از این شاخص ­ها کاربرد خاص خود را دارند. مثلا در تحقیقاتی که مقیاس اندازه گیری داده ­ها حداقل فاصله ­ای است «میانگین» بهترین شاخص است اما در تحقیقاتی که مقیاس اندازه گیری داده ­ها رتبه ای یا اسمی باشد «میانه» یا «نما» مناسب تر هستند.

محاسبه شاخص ­های پراکندگی

شاخص­ های پراکندگی برخلاف شاخص ­های مرکزی هستند چرا که میزان پراکندگی با تغییراتی که در بین داده ­های یک توزیع (نتایج تحقیق) وجود دارد را نشان می­ دهند.

شاخص­ هایی که به این منظور در تحقیقات مورد استفاده قرار می ­گیرند شامل دامنه تغییرات، انحراف چارگی (Quartile Deviation)، واریانس (Variance) و انحراف استاندارد (Standard Deviation) می­ شود. پس از محاسبه شاخص ­های مرکزی و پراکندگی می­ توان نمره ­های استاندارد را محاسبه و منحنی طبیعی (Z) را ترسیم کرد.

محاسبه همبستگی

در برخی از تحقیقات، پژوهشگر می­ خواهد رابطه بین دو متغیر را تعیین کند و به همین منظور باید از روش ­های همبستگی (Correlation) استفاده کند.

در محاسبه همبستگی، نوع مقیاس اندازه گیری دخالت دارد و به طور کلی به دو دسته پارامتری و ناپارامتری تقسیم می­ شود.

رگراسیون و پیش بینی

رگراسیون (Regression) به روشی برای مطالعه سهم یک یا چند متغییر مستقل در پیش بینی متغیر وابسته گفته می­ شود.

از تحلیل رگراسیون می ­توان در تحقیقات توصیفی (غیر آزمایشی) و تحقیقات آزمایشی استفاده کرد. با توجه به نوع تحقیق و متغیرهای آن، روش متنوعی برای تحلیل رگراسیون وجود دارد که برخی از آنها عبارتند از رگراسیون خطی، رگراسیون انحنایی، رگراسیون لوجیستیک و تحلیل کواریانس.

آمار استباطی چیست؟

در آمار توصیفی به جمع آوری و تمرکز به روی خصوصیات و ویژگی­ های مهم داده ­ها می پردازیم و به نوعی می­ توان گفت نقش آمار توصیفی جمع آوری، خلاصه کردن و توصیف اطلاعات کمی به دست آمده از نمونه ­ها یا جامعه است اما قرار نیست کار یک محقق با توصیف اطلاعات به پایان برسد بلکه باید آنچه از بررسی گروه نمونه به دست آورده است را به گروه ­های مشابه بزرگ تر تعمیم دهد.

در آمار استنباطی (Inferential)، پژوهشگر با استفاده از مقادیر نمونه، آماره ­ها را محاسبه کرده و با کمک تخمین یا آزمون فرض آماری، آماره ­ها را به پارامترهای جامعه تعمیم می ­دهد. هدف آمار استنباطی، برآورد کردن خصوصیات و ویژگی ­های جامعه آماری است.

آزمون­ های آمار استنباطی

آزمون ­های آماری مورد استفاده جهت تجزیه و تحلیل اطلاعات به دست آمده از یک گروه کوچک یا نمونه و تعمیم آن به جامعه مورد نظر با توجه به مقیاس اندازه گیری متغیرها، به دو گروه پارامتریک و ناپارامتریک تقسیم می ­شوند.

آزمون­ های پارامتریک، به تجزیه و تحلیل اطلاعات در سطح مقیاس فاصله ای و نسبتی می پردازند و حداقل شاخص آماری آ نها، میانگین و واریانس است.

در حالیکه آزمون­ های ناپارامتریک، به تجزیه و تحلیل اطلاعات در سطح مقیاس اسمی و رتبه ای می­پردازند که شاخص آماری آنها میانه و نما است.

آمار پارامتریک نیاز به پیش فرض ­هایی در مورد جامعه­ ای که از آن نمونه گیری صورت گرفته است دارد.

به عنوان مهم ­ترین پیش فرض در آمار پارامتریک، فرض می ­شود که توزیع جامعه نرمال است اما آمار ناپارامتریک مستلزم هیچگونه فرضی در مورد توزیع نیست. به همین دلیل، در بسیاری از تحقیقات علوم انسانی که با مقیاس ­های کیفی سنجیده شده و فاقد توزیع (Free of distribution) هستند از شاخص ­های آماری ناپارامتریک استفاده می ­کنند.

از آزمون­ های پارامتریک آمار استنباطی می­ توان به آزمون t، تحلیل واریانس (ANOVA)، تحلیل واریانس چند عاملی(MANOVA)، تحلیل کوواریانس چند عاملی و ضریب همبستگی گشتاوری پیرسون نام برد.

همچنین از آزمون­ های ناپارامتریک نیز می­ توان به آزمون علامت تک نمونه، آزمون علامت زوجی، ویلکاکسون، مان_ویتنی، کروسکال_والیس، فریمن، آزمون تقارن توزیع و کولموگروف-اسمیرنف اشاره کرد.

ابزار لازم برای انجام تحلیل آماری

یکی از ابزار اصلی مورد نیاز برای انجام و نگارش تحلیل آماری، نرم افزارهای تحلیل آماری از جمله نرم افزار spss است.

در واقع تصور انجام تحلیل آماری بدون استفاده از نرم افزارهای آماری غیرممکن است چرا که این کار نیاز به عملیات آماری خاصی دارد که محاسبات آن به صورت دستی نه تنها بسیار سخت و زمان بر است بلکه غیرممکن به نظر می ­رسد.

به همین دلیل بسیاری از محققان و دانشجویان برای تکمیل بخش آماری پایان نامه خود (فصل 4 پایان نامه) تحلیل آماری را برون سپاری می ­ کنند یعنی این کار را به شرکت ­های آماری می ­سپارند تا کاملا دقیق و با تخصص خاصی انجام بگیرد.

تحلیل آماری در تمام زمینه­ ها از جمله پژوهش ­های دانشگاهی پرکاربرد است اما برای انجام آن نیاز به مهارت و دقت بالایی در استفاده از نرم افزارهای تحلیل آماری است که پیچیدگی­ های خاص خودشان را دارند، به همین دلیل چه شرکت ­ها و سازمان ­ها چه بسیاری از دانشجویان انجام تحلیل آماری خود را به شرکت ­هایی می­ سپارند که سال­ ها در این زمینه فعالیت داشته اند، با این کار اطمینان حاصل می کنند تحلیل آماری پروژه­شان با دقت و اطمینان بالایی انجام می ­گیرد.

تفاوت بین کواریانس و همبستگی(correlation)

در تئوری احتمال و آمار عبارت کواریانس و همبستگی (correlation) خیلی شبیه هم هستند. هر دو پارامتر میزان ارتباط خطی بین دو تا متغیر را توصیف می کنند و با کمک کواریانس و همبستگی می‌توان میزان وابستگی یک متغیر را به یک متغیر دیگه بررسی کرد. ولی تفاوت این دو در چی هست؟

در آمار از کواریانس و همبستگی برای بررسی ارتباط خطی دو بین دو متغیر و اندازه گیری میزان وابستگی آنها به همدیگر استفاده میکنند! ولی آیا هر دو عین هم هستند؟ خیر!

همبستگی جهت و شدت ارتباط بین دو متغیر را مشخص میکند، در حالی که کواریانس تنها جهت ارتباط بین دو متغیر را مشخص می‌کند.

اجازه بدهید با یک مثال ساده این مسئله را بررسی کنیم، فرض کنید که در یک مطالعه ای میخواهید قد افراد در جامعه ایران را بررسی کنید و ببینید قد افراد به چه صورت توزیع شده است. برای اینکار یک تعداد افراد از جامعه را به صورت کاملا تصادفی انتخاب می‌کنید و قد این افراد را اندازه گیری می‌کنید. فرض کنید که قد افرادی که بررسی کردید به صورت زیر است.

فرق بین کواریانس و همبستگی

الان شما یک مجموعه‌ای تک متغیره دارید و اگر بخواهید این مجموعه را از لحاظ آماری بررسی کنید نیاز به محاسبه میانگین و واریانس قد افراد دارید.

میانگین

حد وسط یک داده را مشخص میکند. در این مثال میانگین قد افراد در جامعه را مشخص میکند.

واریانس

میزان تغییرات حول میانگین را مشخص می کند. واریانس کمتر به این معنی است که قد افراد جامعه خیلی شبیه هم هست ولی اگر واریانس زیاد باشد نشان میدهید که قد افراد در جامعه رنج تغییرات زیادی دارد.

خب با همین دو پارامتر میتوانیم به صورت آماری یک مجموعه تک متغیره را بررسی کنیم.

میانگین و واریانس

حال بیایید مثال را تغییر بدهیم، فرض کنید که می‌خواهید ارتباط بین وزن و قد افراد را بررسی کنید. و برای همین منظور تعدادی از افراد جامعه را به صورت کاملا تصادفی انتخاب می‌کنید، و وزن و قد این افراد را اندازه گیری می‌کنید .

در این مسئله میخواهیم بدانیم که چه ارتباط خطی بین قد و وزن افراد وجود دارد. برای مثال میخواهیم بدانیم آیا با تغییر قد افراد وزن افراد هم تغییر کرده یا نه. و اگر تغییر کرده این تغییرات به چه شکل بوده است. برای بررسی ارتباط خطی بین دو تا مجموعه تک متغیره از کواریانس و همبستگی استفاده می کنند.

کواریانس

کواریانس دو تا متغیر را میتوان طبق رابطه زیر محاسبه کرد و مقدار بدست آمده یک عددی بین [-∞ :+ ∞] است.

کواریانس تنها جهت(direction) ارتباط بین دو متغیر را مشخص میکند. بعنی مشخص می‌کند که ارتباط بین دو متغیر مثبت ، منفی و یا صفر است.

  • اگر کواریانس بین قد و وزن افراد مثبت باشد، یعنی با افزایش قد افراد جامعه، وزنها انها هم افزایش می یابد و یا برعکس با کاهش قد افراد، وزن افراد نیز کاهش می یابد
  • اگر کواریانس بین قد و وزن افراد منفی باشد، یعنی با افزایش قد افراد جامعه، وزنها افراد کاهش می یابد و یا برعکس با کاهش قد افراد، وزن افراد نیز افزایش می یابد
  • اگر کواریانس بین قد و وزن افراد صفر باشد، یعنی با افزایش یا کاهش قد افراد جامعه، وزنها انها تغییری نمی‌کند.

حال فرض کنید کواریانس بین دو تا متغیر شده عدد 15، به نظر شما این عدد چه چیزی را مشخص می‌کند؟ آیا می‌توان گفت ارتباط خطی بین دو متغیر بسیار زیاد هست؟ نه نمیتوان گفت. ما از روی کواریانس بدست آمده تنها جهت ارتباط بین دو متغیر را میتوانیم متوجه شویم، ولی اینکه شدت ارتباط بین دو متغیر چقدر هست را نمیتوان متوجه شد!

همبستگی

همسبتگی همان کواریانس نرمال شده است و طبق رابطه زیر میتوانیم همبتسگی بین دو متغیر را بدست آوریم.

همسبتگی یک عدد بین [-1:+1] هست و جهت(direction) و شدت-میزان (strength) ارتباط خطی بین دو متغیر را مشخص می‌کند.

هر چقدر همبستگی به عدد +1 نزدیک باشد، به معنی است که بین دو متغیر خطی ارتباط خطی مثبت زیادی وجود دارد. یعنی با افزایش قد افراد، وزن افراد هم افزایش پیدا میکند و برعکس. یک ارتباط مستقیم بین دو متغیر وجود دارد.

هر چقدر همبستگی به عدد -1 نزدیک باشد، به معنی است که بین دو متغیر خطی ارتباط خطی منفی زیادی وجود دارد. یعنی با افزایش قد افراد، وزن افراد کاهش پیدا میکند و برعکس. یک ارتباط عکس بین دو متغیر وجود دارد.

اگر همبستگی دو متغیر نزدیک به عدد 0 باشد معنیش این است که با تغییرات مقدار یک متغیر، تغییر در مقدار متغیر دوم اتفاق نمی افتد!

همبستگی

حالا سوال اینه که اگر هر دو مجموعه به جای تک متغیره، چند متغیره باشند چیکار کنیم؟ از چه ابزاری برای بررسی ارتباط بین دو مجموعه چند متغیره استفاده کنیم؟

یکی از الگوریتمهای معروفی که میتوان با کمک آن ارتباط خطی بین دو مجموعه چند متغیره را بررسی کرد الگوریتم CCA ، تجزیه همسبتگی کانونی است. در دوره واسط مغز کامپیوتر مبتنی بر SSVEP به طور کامل تئوری این روش رو توضیح داده و پیاده سازی کرده ایم.



اشتراک گذاری

دیدگاه شما

اولین دیدگاه را شما ارسال نمایید.