جستجو کردن
Close this search box.

آموزش رگرسیون خطی ساده در نرم افزار SPSS

آموزش رگرسیون خطی ساده در نرم افزار SPSS
فهرست مطالب

رگرسیون خطی یکی از مهم ترین روش های تحلیل آماری است. بگذارید ابتدا با یک مثال شروع کنم:آیا شخصیت کارکان در یک سازمان می تواند عملکرد آینده آنان را پیش بینی کند؟ انگیزه و شخصیت کارکنان بر روی عملکرد آنان در سازمان موثر خواهد بود؟ آیا مصرف این دارو جدید می تواند میزان ابتلا به بیماری را در آینده پیش بینی کند؟ این ها سوالاتی هستند که هر پژوهشگری زمانی که با آن مواجه می شود، به سراغ روش رگرسیون می رود. با کیارا آکادمی در این آموزش همراه باشید تا به صورت کامل اجرا و تفسیر رگرسیون را بیاموزید.

رگرسیون خطی

رگرسیون خطی چیست؟ رگرسیون خطی یک نوع اساسی و رایج از تجزیه و تحلیل پیش بینی و رگرسیونی است. ایده کلی رگرسیون بررسی دو چیز است:

  • (1) آیا مجموعه ای از متغیرهای پیش بینی کننده کار خوبی در پیش بینی یک متغیر نتیجه (وابسته) انجام می دهند؟
  • (2) به ویژه کدام متغیرها پیش بینی کننده های مهم متغیر نتیجه هستند، و به چه طریقی – که با بزرگی و علامت تخمین های بتا نشان داده شده اند- بر متغیر نتیجه تأثیر می گذارند؟

این تخمین های رگرسیون برای توضیح رابطه بین یک متغیر وابسته و یک یا چند متغیر مستقل استفاده می شود. ساده ترین شکل معادله رگرسیون با یک متغیر وابسته و یک متغیر مستقل با فرمول زیر تعریف می شود، که در آن:

y = c + b*x
  • y = نمره متغیر وابسته تخمینی
  • c = ثابت
  • b = ضریب رگرسیون
  • x = امتیاز بر روی متغیر مستقل

نام گذاری متغیرها نام های زیادی برای متغیر وابسته رگرسیون وجود دارد.

ممکن است آن را متغیر نتیجه، متغیر معیار، متغیر درون زا یا رگرسیون نامید. متغیرهای مستقل را می‌توان متغیرهای برون‌زا، متغیرهای پیش‌بینی‌کننده یا رگرسیون نامید. سه کاربرد اصلی برای تحلیل رگرسیون عبارتند از :

  • (1) تعیین قدرت پیش بینی کننده ها
  • (2) پیش بینی یک اثر
  • (3) پیش بینی روند

کاربرد رگرسیون خطی

  1. اول، رگرسیون ممکن است برای شناسایی قدرت اثری که متغیر(های) مستقل بر روی یک متغیر وابسته دارند، مورد استفاده قرار گیرد. سوالات معمولی این است که قدرت رابطه بین دوز و اثر، هزینه های فروش و بازاریابی، یا سن و درآمد چیست.
  2. دوم، می توان از آن برای پیش بینی اثرات یا تأثیر تغییرات استفاده کرد. یعنی تحلیل رگرسیون به ما کمک می کند تا بفهمیم که متغیر وابسته با تغییر یک یا چند متغیر مستقل چقدر تغییر می کند. یک نمونه سوال این است که “برای هر یک میلیون تومان اضافی که برای بازاریابی خرج می شود چقدر درآمد اضافی از فروش دریافت می کنم؟”
  3. سوم، تحلیل رگرسیون روندها و ارزش های آینده را پیش بینی می کند. از تحلیل رگرسیون می توان برای بدست آوردن تخمین های نقطه ای استفاده کرد. یک سوال معمولی این است که “قیمت طلا تا 6 ماه آینده چقدر خواهد بود؟”

 

رگرسیون چیست؟

همه ما انسان ها به دنبال پیش بینی آینده هستیم. دوست داریم آینده خودمان را بدانیم. سهمی که در بازار خریده این در آینده چه می شود ؟ آینده کشور چطور خواهد شد؟ این ها همه سئوال هایی از آینده است. خیلی از انسان ها سعی کرده اند در طول تاریخ به روش های مختلف بعضا حتی به وسیله خرافات آینده را پیش بینی کنند، ولی همه این روش ها، دروغ یا خیال پردازی بیشتر نیست.

 

علم آمار بر اساس داده های موجود و روش های رگرسیونی به ما کمک خواهد کرد تا به صورت علمی به پیش بینی آینده بپردازیم. در این بین فرانسیس گالتون (۱۸۷۷) اولین دانشمندی بود که از رگرسیون در جهت تحقیقات خود استفاده نمود. امروزه روش رگرسیون یکی از پرکاربردترین روش های آماری است.

کاربرد روش رگرسیون

با استفاده از روش رگرسیون آماردانان می توانند، روابط بین متغیرها را شناسایی کنند و سپس به پیش بینی آن بپردازند. در اصل می توان گفت نتیجه آزمون رگرسیون، یک معادله‌ای است که پیشگویی یک متغیر وابسته (متغیری که می خواهیم آن را پیش بینی کنیم) را بر اساس یک یا چند متغیر مستقل (متغیری که به عنوان پیش بین در نظر گرفته ایم) نشان می‌دهد. برای مثال در تحقیق پیش بینی رفتار های سازمانی بر اساس شخصیت کارکنان، متغیر شخصیت پرسنل به عنوان متغیر پیش گو در نظر گرفته می شود، که بر رفتار های سازمانی کارکنان (به عنوان متغیر وابسته) تاثیر می‌گذارد.

 

انواع روش رگرسیون

گفتیم در روش رگرسیون خطی پژوهشگر به دنبال یافتن رابطه بین متغیر وابسته و مجموعه‌ ای از متغیرهای مستقل به عنوان متغیر پیشگو می باشد. اما باید اشاره کرد با توجه به نوع متغیرها (این که پیوسته اند یا ترتیبی) و اهداف پژوهش (قصد داریم یک جا پیش بینی کنیم یا به صورت بلوک بندی شده ؟)، نوع مدل رگرسیونی ممکن است متفاوت باشد.

روش رگرسیون خطی

ساده‌ترین مدل‌ رگرسیون خطی، این مدل می باشد که دو نوع دارد :

رگرسیون خطی ساده

در این مدل از رگرسیون خطی فقط یک متغیر مستقل (پیش‌بین) وجود دارد. برای مثال آیا میزان اعتماد سازمانی بر انگیزش کارکنان تاثیرگذار هست یا نه؟ و می تواند انگیزه را پیش بینی نماید؟ در مدل رگرسیون خطی ساده، متغیر وابسته را با Y و متغیر پیش بین را با X مشخص می کنند و معادله خط رگرسیون ساده را به این شکل می نویسند: Y=aX+b

رگرسیون خطی چندگانه

در این مدل از رگرسیون ما شاهد وجود بیش از یک متغیر مستقل (پیش‌بین) هستیم. برای مثال، آیا میزان اعتماد کارکنان و سطح دستمزد آنان بر انگیزش آنها تاثیرگذار هست یا نه؟ و این دو متغیر می توانند انگیزش را پیش بینی نمایند؟

آموزش رگرسیون خطی چندگانه در spss

رگرسیون غیر خطی

برخی از متغیرها با تابع غیرخطی مشخص شده ای با هم رابطه دارند. زمانی که متغیرهای وابسته ما به صورت ترتیبی سنجیده شده باشند (نه پیوسته) نمی توان از رگرسیون ساده استفاده کرد.

رگرسیون لجستیک

مدل رگرسیون لجستیک برای تبیین پیش‌بینی متغیرهای ترتیبی روش مناسبی است.

آموزش رگرسیون لجستیک در spss

مفروضه های رگرسیون

قبل از انجام تحلیل های مدل رگرسیونی باید مفروضه های استفاده از این مدل ها را بررسی کنیم. این مفروضه ها شامل این موارد می باشد:

خطی بودن

ابتدا باید ببینیم آیا رابطه ای خطی شکل بین داده ها وجود دارد یا خیر؟ با ترسیم نمودار پراکندگی می توان رابطه خطی بین داده ها را مشخص کرد و در عین حال وجود رابطه خطی به شما نشان می دهد که می توانیم از روش رگرسیون استفاده نماییم. برای چنین کاری علاوه بر ترسیم نمودار، می توان ضریب همبستگی (Pearson) متغیرهای خودمان را هم بررسی کنیم. از بررسی نمودار اسکتر دات، علاوه بر فهم خطی بودن یا غیر خطی بودن رابطه متغیرها و مثبت یا منفی بودن رابطه را نیز می فهمیم. این که نمودار به سمت بالا می رود یا به سمت پایین نشان از رابطه مثبت یا منفی است. در نمودار پراکندگی، متغیر مستقل ( پیشگو) در محور افقی قرار می گیرد و متغیر وابسته هم در محور عمودی قرار می‌گیرد.

آموزش رگرسیون خطی ساده در نرم افزار SPSS اکنون خروجی نمودار را مشاهده می کنید:

آموزش رگرسیون خطی ساده در نرم افزار SPSS

بررسی بهنجاری در آمار

مفروضه بعدی بهنجاری است. باید از تست کولموگراف – اسمیرنوف این مفروضه را تایید یا رد کرد.

آموزش اجرای تست کولموگراف – اسمیرنوف

سطح سنجش متغیر ها

متغیرهای مستقل ممکن است پیوسته یا گسسته باشند، ولی متغیر وابسته باید در سطح سنجش کمی به صورت پیوسته باشد.

بررسی نقاط پرت

از بررسی نمودار اسکتردات، همچنین می توان نقاط پرت را شناسایی کرد. نقاطی که در نمودار موجود است، ولی از دیگر نقاط موجود بسیار دور هستند، همان نقاط پرت می باشند. نقاط پرت، بر روی نتایج مدل رگرسیونی اثر می‌گذارند و اگر تعداد آن ها زیاد باشد و نتیجه را تحت تاثیر قرار دهد، باید این نقاط حذف و یا اصلاح شوند.

آموزش رگرسیون خطی ساده در نرم افزار SPSS

نقاط پرت را می‌توان علاوه بر رسم نمودار پراکندگی از طریق ترسیم جدول فراوانی هم پیدا کرد. بررسی نقاط پرت در حالت های چند متغیره باید با استفاده از فاصله ماهالانوبیس بررسی شوند.

آموزش روش های شناسایی و حذف داده های پرت

چند هم خطی بین متغیرهای مستقل و تکینی

  • چند هم خطی همان همبستگی قوی بین خود متغیرهای پیش بین می باشد.البته در روش رگرسیون خطی ساده نیاز به بررسی این موارد نیست چرا که یک متغیر مستقل دارید.
  • تکینی (singularity) هم به حالتی گفته می شود که همبستگی یک (صد درصد ) بین متغیرهای پیش بین باشد. می شود این مفروضه ها را با بررسی ماتریس همبستگی و تولرانس مشخص نمود.

آموزش رگرسیون خطی ساده در نرم افزار SPSS

نرمال بودن

توزیع داده ها باید به شکل توزیع نرمال باشد. برای بررسی این مفروضه باید از آزمون های نرمال بودن داده ها استفاده کنیم. البته اگر حجم نمونه تحقیق زیاد باشد می توان از این مفروضه چشم پوشی کرد.

آموزش رگرسیون خطی ساده در نرم افزار SPSS

همگنی واریانس‌ها

آیا واریانس توزیع ها یکسان است؟ قبل از اجرای و تفسیر خروجی های اصلی آزمون‌های رگرسیون، برابری واریانس‌ها در جامعه آماری باید بررسی شود. این مفروضه با استفاده از آزمون لون (Levene’s Test) که در خروجی ها به آن می پردازیم بررسی می شود.

حجم نمونه برای رگرسیون خطی ساده

کمترین تعداد نمونه مورد نیاز برای انجام رگرسیون باید حداقل پنج برابر تعداد متغیرهای پیش بین باشد.

آموزش اجرای رگرسیون خطی

داده ها را وارد نرم‌ افزار SPSS می کنیم. سپس از منو Analyze گزینه Regression را انتخاب می کنیم و سپس Linear را می زنیم.

آموزش اجرای رگرسیون خطی

باید متغیر های خود را به تحلیل اضافه کنیم. در قسمت Dependent، متغیر وابسته را وارد می کنیم. سپس در Independent(s) متغیر پیش بین را وارد می‌کنیم. در بخش Method گزینه Enter به صورت پیش فرض وجود دارد ، آن را نباید تغییر بدهیم و در آخرین مرحله گزینه OK را بزنید.

آموزش رگرسیون خطی ساده در نرم افزار SPSS

وارد بخش Plots می شویم و گزینه ها را بر اساس تصویر وارد کادر روبه رویی می کنیم. گزینه Normal probability plot را هم فعال نمایید و در پایان روی گزینه Continue کلیک کنید.

آموزش رگرسیون خطی ساده در نرم افزار SPSS

وارد بخش Save شوید و دو تیک Mahalanobis و Cooks را فعال می کنیم . این عمل برای بررسی مفروضه داده های پرت در روش رگرسیون به کار می آید .

آموزش رگرسیون خطی ساده در نرم افزار SPSS

وارد بخش Options می شویم و گزینه Exclude Cases Pairwise را بزنید. با این گزینه تعداد مشاهدات دارای اعتبار برای تحلیل از یک متغیر به متغیر دیگر متفاوت خواهد بود.

آموزش رگرسیون خطی ساده در نرم افزار SPSS

آموزش تفسیر خروجی های رگرسیون خطی

جدول Model Summary: در این جدول باید به آماره ی R Square توجه نمایید. این آماره را در صد ضرب کنید. عدد بدست آمده نشانگر درصد سهم مدل در بیان پراکندگی متغیر وابسته است. استفاده از این آماره در روش رگرسیون بسیار اهمیت دارد.

آموزش رگرسیون خطی ساده در نرم افزار SPSS

جدول ANOVA در تحلیل رگرسیون

در این جدول باید به سطح معنی داری توجه نمایید. اگر میزان Sig. در این جدول معنی دار بود (کوچکتر از 0.05) متوجه می شویم مدل ما، معنی دار است .

آموزش رگرسیون خطی ساده در نرم افزار SPSS

جدول Coefficients : برای مشخص کردن اهمیت متغیر پیش بین و نقش آن‌ در مدل رگرسیونی تحقیق، باید به ستون بتا در بخش ضرایب استاندارد شده توجه نمود. عدد بدست آماده را در صد ضرب می کنید. مقدار حاصل شده نشان می دهد که چند درصد واریانس متغیر وابسته توسط متغیر پیش بین تبیین می شود.

آموزش رگرسیون خطی ساده در نرم افزار SPSS

پیشنهاد می کنم برای حرفه ای شدن در تحلیل های آماری از دوره spss کیارا آکادمی دیدن کنید. برای استفاده از دوره جامع spss می توانید از لینک زیر استفاده کنید:

آموزش رایگان spss

تجزیه و تحلیل رگرسیون خطی با استفاده از SPSS

رگرسیون خطی مرحله بعدی بعد از همبستگی است. زمانی استفاده می شود که بخواهیم مقدار یک متغیر را بر اساس مقدار متغیر دیگری پیش بینی کنیم. متغیری که می خواهیم پیش بینی کنیم، متغیر وابسته (یا گاهی اوقات، متغیر نتیجه) نامیده می شود. متغیری که برای پیش‌بینی مقدار متغیر دیگر استفاده می‌کنیم، متغیر مستقل (یا گاهی اوقات، متغیر پیش‌بینی‌کننده) نامیده می‌شود. به عنوان مثال، می توانید از رگرسیون خطی برای درک این که:

  • آیا عملکرد امتحان بر اساس زمان بازبینی قابل پیش بینی است یا خیر، استفاده کنید؟
  • آیا می توان مصرف سیگار را بر اساس مدت زمان مصرف سیگار پیش بینی کرد؟

اگر به جای یک متغیر، دو یا چند متغیر مستقل دارید، باید از رگرسیون چندگانه استفاده کنید.

مفروضات رگرسیون خطی

هنگامی که تصمیم می گیرید داده های خود را با استفاده از رگرسیون خطی تجزیه و تحلیل کنید، بخشی از فرآیند شامل بررسی می شود تا مطمئن شوید که داده هایی که می خواهید تجزیه و تحلیل کنید واقعاً می توانند با استفاده از رگرسیون خطی تجزیه و تحلیل شوند. شما باید این کار را انجام دهید زیرا تنها زمانی استفاده از رگرسیون خطی مناسب است که داده‌های شما از هفت فرض لازم برای رگرسیون خطی عبور کند تا نتیجه معتبری به شما بدهد. ابتدا، بیایید به این هفت فرض نگاهی بیندازیم:

فرض شماره 1:

متغیر وابسته شما باید در سطح پیوسته اندازه گیری شود (به عنوان مثال، متغیر بازه یا نسبت است). نمونه‌هایی از متغیرهای پیوسته عبارتند از: زمان تجدیدنظر (اندازه‌گیری شده بر حسب ساعت)، هوش (اندازه‌گیری شده با استفاده از امتیاز IQ)، عملکرد امتحان (اندازه‌گیری شده از 0 تا 100)، وزن (اندازه‌گیری شده بر حسب کیلوگرم).

آموزش تحلیل عاملی تاییدی

فرض شماره 2:

متغیر مستقل شما نیز باید در سطح پیوسته اندازه گیری شود (یعنی متغیر بازه یا نسبت است). برای نمونه‌هایی از متغیرهای پیوسته به گلوله بالا مراجعه کنید.

فرض شماره 3:

باید یک رابطه خطی بین دو متغیر وجود داشته باشد. در حالی که چندین راه برای بررسی وجود رابطه خطی بین دو متغیر شما وجود دارد، پیشنهاد می کنیم با استفاده از SPSS یک نمودار پراکنده ایجاد کنید که در آن می توانید متغیر وابسته را در برابر متغیر مستقل خود رسم کنید و سپس به صورت بصری نمودار پراکندگی را برای بررسی خطی بودن بررسی کنید. نمودار پراکندگی شما ممکن است چیزی شبیه به یکی از موارد زیر باشد:

 رگرسیون خطی linear relationship between the two variables

اگر رابطه نمایش داده شده در نمودار پراکندگی شما خطی نیست، باید یک تحلیل رگرسیون غیر خطی انجام دهید، یک رگرسیون چند جمله ای انجام دهید یا داده های خود را “تبدیل” کنید، که می توانید با استفاده از آمار SPSS انجام دهید.

فرض شماره 4:

نباید نقاط پرت قابل توجهی وجود داشته باشد. نقطه پرت یک نقطه داده مشاهده شده است که دارای یک مقدار متغیر وابسته است که با مقدار پیش بینی شده توسط معادله رگرسیون بسیار متفاوت است. به این ترتیب، نقطه پرت نقطه ای در یک نمودار پراکنده خواهد بود که (به طور عمودی) از خط رگرسیون دور است و نشان می دهد که باقیمانده زیادی دارد، همان طور که در زیر مشخص شده است:

  • مشکل پرت ها این است که می توانند تأثیر منفی بر تحلیل رگرسیون داشته باشند (به عنوان مثال، تناسب معادله رگرسیون را کاهش دهند) که برای پیش بینی مقدار متغیر وابسته (نتیجه) بر اساس متغیر مستقل (پیش بینی کننده) استفاده می شود.
  • خروجی را که SPSS تولید می کند تغییر می دهد و دقت پیش بینی نتایج شما را کاهش می دهد.
  • خوشبختانه، هنگام استفاده از آمار SPSS برای اجرای یک رگرسیون خطی بر روی داده‌های خود، می‌توانید به راحتی معیارهایی را برای کمک به تشخیص موارد دور از دسترس در نظر بگیرید.
آموزش جامع spss

فرض شماره 5:

شما باید از مشاهدات استقلال داشته باشید که به راحتی می توانید با استفاده از آمار Durbin-Watson که یک تست ساده برای اجرا با استفاده از آمار SPSS است بررسی کنید.

فرض شماره 6:

داده های شما باید همسانی را نشان دهند، جایی که واریانس ها در امتداد خط بهترین تناسب مشابه با حرکت شما در طول خط باقی می مانند. به سه نمودار پراکندگی زیر نگاهی بیندازید:

ناهم‌واریانس (heteroscedastic) رگرسیون خطی

دو مورد از داده هایی که این فرض را انجام نمی دهند (به نام ناهم‌ واریانسی (heteroscedastic)) و یکی از داده هایی که این فرض را برآورده می کند (به نام homoscedasticity)

فرض شماره 7:

در نهایت، شما باید بررسی کنید که باقیمانده‌ها (خطاهای) خط رگرسیون تقریباً به طور معمول توزیع شده‌اند. دو روش متداول برای بررسی این فرض شامل استفاده از هیستوگرام (با منحنی نرمال روی هم قرار داده شده) یا نمودار P-P نرمال است.

با استفاده از SPSS می توانید فرضیات 3، 4، 5، 6 و 7 را بررسی کنید.

مثال پژوهشی برای رگرسیون خطی

یک فروشنده برای یک برند بزرگ خودرو می خواهد تعیین کند که آیا رابطه ای بین درآمد یک فرد و قیمتی که برای یک ماشین می پردازد وجود دارد یا خیر. به این ترتیب، «درآمد» افراد، متغیر مستقل و «قیمت» که برای خودرو می پردازند، متغیر وابسته است. فروشنده می خواهد از این اطلاعات برای تعیین اینکه کدام خودروها را به مشتریان بالقوه در مناطق جدیدی که درآمد متوسط مشخص است، ارائه دهد، استفاده کند.

مطالعه منابع بیشتر رگرسیون خطی:

Principal Components Analysis (PCA) using SPSS Statistics 

16 پاسخ

    1. مرسی از سوالت
      ببین در کل باید اشاره کنم که سه راه متداول برای رفع ناهم واریانسی وجود داره:

      1. تغییر متغیر وابسته البته به صورتی که مرتبط باشه. برای مثال، اگر از اندازه جمعیت (متغیر مستقل) برای پیش‌بینی تعداد گل‌ فروشی‌ها در یک شهر استفاده می‌کنیم (متغیر وابسته)، ممکن است در عوض سعی کنیم از اندازه جمعیت برای پیش‌بینی گزارش تعداد گل‌فروشی‌های یک شهر استفاده کنیم.

      2. متغیر وابسته را دوباره تعریف کنیم. به عنوان مثال، به جای استفاده از اندازه جمعیت برای پیش‌بینی تعداد گل‌فروشی‌های یک شهر، ممکن است در عوض از اندازه جمعیت برای پیش‌بینی تعداد سرانه گل‌فروشی‌ها استفاده کنیم.

      3.استفاده از رگرسیون وزنی :این نوع رگرسیون وزنی را به هر نقطه داده بر اساس واریانس مقدار برازش آن اختصاص می دهد. اساساً، این به نقاط داده‌ای که دارای واریانس بالاتری هستند وزن‌های کوچکی می‌دهد که مجذور باقیمانده آنها را کوچک می‌کند. هنگامی که از وزنه های مناسب استفاده می شود، این می تواند مشکل ناهمسانی را از بین ببرد.

    1. مرسی از شما لطف کردید
      تلگرام هم قصد داریم ولی به دلیل مشکلات فیلترینگ و…. دیگه می دونید چقدر دشوار شده

      فعلا کانال یوتوب و آپارات مون فعاله

      افتخار دادید به سایت ما سر زدید

  1. سلام من وقتی میخوام رگرسیون بگیرم هرچی هم متغیر های متفاوتی به سیستم میدم بازم R رو در جدول اول برای من 000 مینویسه. یعنی برای متغیر هایی که نمودار پراکنش نشون میده هم بستگی دارن هم باز R رو صفر میزنه. علت چیه؟

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *