تحلیل مولفه های اصلی (PCA) با SPSS

تجزیه و تحلیل اجزای اصلی (PCA) با SPSS
فهرست مطالب

در این آموزش همراه کیارا آکادمی باشید تا به صورت کاربردی تحلیل مولفه های اصلی (PCA) با SPSS را بیاموزید.

آموزش تجزیه و تحلیل مؤلفه‌ های اصلی

این روش که به اختصار PCA نیز گفته می شود یک تکنیک کاهش متغیر است که شباهت های زیادی به تحلیل عاملی اکتشافی دارد. هدف تحلیل مؤلفه‌های اصلی کاهش مجموعه بزرگ‌تری از متغیرها به مجموعه‌ای کوچک‌تر از متغیرهای «مصنوعی» است که «مؤلفه‌های اصلی» نامیده می‌شوند، که بیشتر واریانس متغیرهای اصلی را تشکیل می‌دهند.

کاربرد تحلیل مؤلفه‌ های اصلی

تعدادی کاربرد متداول برای PCA وجود دارد:

  • (الف) شما متغیرهای زیادی را اندازه گیری کرده اید (به عنوان مثال، 7-8 متغیر، که به صورت 7-8 سوال یا گزاره در یک پرسشنامه نشان داده شده است) و معتقدید که برخی از متغیرها یکسان را اندازه گیری می کنند. ساختار زمینه ای (به عنوان مثال، افسردگی). اگر این متغیرها همبستگی بالایی دارند، ممکن است بخواهید فقط آن دسته از متغیرها را در مقیاس اندازه گیری خود بگنجانید (مثلاً پرسشنامه شما) که احساس می کنید بیشتر نمایانگر سازه هستند و بقیه را حذف کنید.
  • (ب) می‌خواهید مقیاس اندازه‌گیری جدیدی ایجاد کنید (مثلاً یک پرسشنامه)، اما مطمئن نیستید که آیا همه متغیرهایی که وارد کرده‌اید، ساختار مورد علاقه‌تان را اندازه‌گیری می‌کنند (مثلاً افسردگی). بنابراین، آزمایش می‌کنید که آیا ساختاری که در حال اندازه‌گیری «بار» روی همه (یا فقط برخی) متغیرهایتان هستید یا خیر. این به شما کمک می کند بفهمید که آیا برخی از متغیرهایی که انتخاب کرده اید به اندازه کافی معرف سازه مورد نظر شما نیستند و باید از مقیاس اندازه گیری جدید حذف شوند.
  • (ج) می‌خواهید آزمایش کنید که آیا مقیاس اندازه‌گیری موجود (مثلاً یک پرسشنامه) می‌تواند کوتاه شود تا شامل موارد کمتری باشد (مثلاً سؤالات یا گزاره‌ها)، شاید به این دلیل که چنین مواردی ممکن است اضافی باشند (یعنی ممکن است بیش از یک آیتم در حال اندازه‌گیری باشند. همان ساختار) و یا ممکن است تمایل به ایجاد مقیاس اندازه گیری وجود داشته باشد که احتمال تکمیل آن بیشتر است (یعنی نرخ پاسخ در پرسشنامه های کوتاه تر بیشتر است). این ها تنها برخی از کاربردهای رایج PCA هستند. همچنین شایان ذکر است که در حالی که PCA از نظر مفهومی با تحلیل عاملی متفاوت است، در عمل اغلب به جای تحلیل عاملی استفاده می شود و در “رویه عامل” در SPSS گنجانده شده است.

آموزش تحلیل عاملی اکتشافی

مفروضات تحلیل مؤلفه‌ های اصلی

هنگامی که تصمیم می گیرید داده های خود را با استفاده از PCA تجزیه و تحلیل کنید، بخشی از فرآیند شامل بررسی می شود تا مطمئن شوید که داده هایی که می خواهید تجزیه و تحلیل کنید واقعاً می توانند با استفاده از PCA تجزیه و تحلیل شوند. شما باید این کار را انجام دهید زیرا تنها زمانی استفاده از PCA مناسب است که داده‌های شما از چهار فرضی که برای PCA لازم است تا نتیجه معتبری به شما ارائه دهد:

فرض شماره 1:

شما چندین متغیر دارید که باید در سطح پیوسته اندازه گیری شوند (اگرچه از متغیرهای ترتیبی بسیار استفاده می شود). نمونه هایی از متغیرهای پیوسته (یعنی متغیرهای نسبت یا فاصله) شامل زمان بازبینی (اندازه گیری شده بر حسب ساعت)، هوش (اندازه گیری شده با استفاده از نمره IQ)، عملکرد امتحان (اندازه گیری از 0 تا 100)، وزن (اندازه گیری شده بر حسب کیلوگرم) و غیره است. نمونه‌هایی از متغیرهای ترتیبی که معمولاً در PCA استفاده می‌شوند شامل طیف گسترده‌ای از مقیاس‌های لیکرت هستند (مثلاً مقیاس ۷ درجه‌ای از «کاملاً موافقم» تا «کاملاً مخالفم»؛ یک مقیاس ۵ درجه‌ای از «هرگز» تا «همیشه»؛ مقیاس 7 درجه ای از “اصلا” تا “خیلی زیاد”؛ مقیاس 5 امتیازی از “مهم نیست” تا “بسیار مهم”).

تحلیل آماری

فرض شماره 2:

باید یک رابطه خطی بین همه متغیرها وجود داشته باشد. دلیل این فرض این است که یک PCA بر اساس ضرایب همبستگی پیرسون است و به این ترتیب، باید یک رابطه خطی بین متغیرها وجود داشته باشد. در عمل، با استفاده از داده های ترتیبی برای متغیرها، این فرض تا حدودی آرام می شود (حتی اگر نباید باشد). اگرچه خطی بودن را می توان با استفاده از یک نمودار پراکنده ماتریسی آزمایش کرد، اما اغلب این امر بیش از حد در نظر گرفته می شود زیرا نمودار پراکندگی گاهی اوقات می تواند بیش از 500 رابطه خطی داشته باشد. به این ترتیب، پیشنهاد می شود که به طور تصادفی فقط چند رابطه ممکن بین متغیرها را انتخاب کنید و آن ها را آزمایش کنید. شما می توانید خطی بودن را در SPSS با استفاده از نمودارهای پراکنده بررسی کنید، و در مواردی که روابط غیر خطی وجود دارد، سعی کنید آن ها را تغییر دهید.

فرض شماره 3:

شما باید کفایت نمونه برداری داشته باشید، به این معنی که برای PCA برای ایجاد یک نتیجه قابل اعتماد، اندازه نمونه به اندازه کافی بزرگ مورد نیاز است. بسیاری از قوانین سرانگشتی مختلف پیشنهاد شده است. اینها عمدتاً بسته به اینکه حجم نمونه مطلق پیشنهاد شده باشد یا مضربی از تعداد متغیرهای نمونه شما استفاده شده باشد، متفاوت است. به طور کلی حداقل 150 مورد یا 5 تا 10 مورد در هر متغیر به عنوان حداقل حجم نمونه توصیه شده است.

چند روش برای تشخیص کفایت نمونه‌ گیری در PCA وجود دارد:

  1. اندازه‌گیری کفایت نمونه‌گیری Kaiser-Meyer-Olkin (KMO) برای مجموعه داده‌های کلی
  2. اندازه گیری KMO برای هر متغیر مجزا

فرض شماره 4:

داده های شما باید برای کاهش داده ها مناسب باشند. به طور موثر، شما باید همبستگی کافی بین متغیرها داشته باشید تا متغیرها به تعداد اجزای کمتری کاهش یابند. روشی که توسط SPSS Statistics برای تشخیص این مورد استفاده می شود، آزمون Bartlett’s test of sphericity است.

شاخص های برازش مدل معادلات ساختاری

فرض شماره 5:

هیچ نقطه پرت قابل توجهی نباید وجود داشته باشد. موارد پرت مهم هستند زیرا می توانند تأثیر نامتناسبی بر نتایج شما داشته باشند. آمار SPSS توصیه می کند که نقاط پرت را به عنوان نمرات مؤلفه های بیشتر از 3 انحراف استاندارد با فاصله از میانگین تعیین کنید.

با استفاده از SPSS می توانید فرضیات 2، 3، 4 و 5 را بررسی کنید.

اجرای تحلیل مؤلفه‌ های اصلی (PCA) در SPSS

یک کارشناس منابع انسانی می خواهد کارمندانی را برای سازمان استخدام کند و به دنبال کسی است که سطوح بالایی از اعتماد را نشان دهد. به منظور انتخاب داوطلبان برای مصاحبه، او پرسشنامه ای مشتمل بر 12 سوال از مقیاس اعتماد سازمانی تهیه کرده (خود او این مقیاس را طراحی کرده تا اعتماد سازمانی کاندیدهای ایرانی را بسنجد) که به نظر او می تواند به این پرسشنامه پاسخ دهد که آیا کاندیداهای درستی دارد یا خیر؟ وی این پرسشنامه را برای 204 داوطلب بالقوه استخدام اجرا کرد. اکنون زمان بررسی تحلیل مؤلفه‌های اصلی است. برای این کار ابتدا باید از بخش Analyze گزینه‌ Dimension Reduction را انتخاب کنید و بر روی Factor کلیک کنید.
اجرای تحلیل مولفه های اصلی (PCA) در SPSS

در گام بعدی باید سوالات مقیاس اعتماد را وارد تحلیل کنید (در قسمت Variables).

تحلیل مولفه های اصلی (PCA) با SPSS

سپس باید بر روی گزینه Descriptives کلیک کنید و از قسمت Statistics گزینه‌ی Initial solution و از قسمت Correlation Matrix گزینه‌های Coefficients و KMO and Bartlett’s test of sphericity و Reproduced و Anti-image را انتخاب کنید و در پایان Continue کلیک کنید.

تحلیل مولفه های اصلی (PCA) با SPSS

در مرحله بعدی باید به بخش Extraction بروید و گزینه Scree plot را در بخش Display فعال کنید. روی Continue کلیک کنید.

تحلیل مولفه های اصلی (PCA) با SPSS

در گام بعدی باید به بخش Rotation بروید و از قسمت Method دوران Varimax را انتخاب و از بخش Display نیز باید دو گزینه Rotated solution و گزینه Loading plot(s) را فعال کنید و سپس روی Continue کلیک کنید.

تحلیل مولفه های اصلی (PCA) با SPSS

سپس باید به بخش Factor Analysis: Factor Scores بروید و گزینه Save as variables را فعال کنید.
تحلیل مولفه های اصلی (PCA) با SPSS

در گام بعدی باید به بخش Options بروید و در قسمت Coefficient Display Format گزینه‌ Supperss absolute values less than و گزینه Sorted by size را انتخاب کنید. بعد از فعال شدن این گزینه یک کادر در رو به روی آن فعال می شود که شما باید عدد 0/3 را در آن تایپ کنید. روش مواجهه با داده های گم شده را نیز در بخش Missing Values باید به حالت پیش فرض باقی بماند. روی Continue کلیک کنید و در پایان گزینه ok را بزنید.

تحلیل مؤلفه‌ های اصلی تحلیل مولفه های اصلی (PCA) با SPSS

تفسیر خروجی ها تجزیه و تحلیل اجزای اصلی

خروجی تولید شده توسط SPSS بسیار گسترده است و می تواند اطلاعات زیادی در مورد تجزیه و تحلیل شما ارائه دهد. با این حال، اغلب متوجه می شوید که تجزیه و تحلیل هنوز کامل نشده است و باید قبل از رسیدن به راه حل نهایی، آنالیز آماری بالا را احتمالاً بیش از یک بار مجدداً اجرا کنید.

مرحله شماره 1:

شما باید نتایج حاصل از آزمون های فرضی خود را تفسیر کنید تا مطمئن شوید که می توانید از PCA برای تجزیه و تحلیل داده های خود استفاده کنید. این شامل تجزیه و تحلیل موارد زیر است:

  • (الف) نمودارهای پراکندگی که باید برای بررسی خطی بودن متغیرهای خود ایجاد می کردید (فرض شماره 2).
  • (ب) کفایت نمونه‌گیری، بر اساس اندازه‌گیری کفایت نمونه‌گیری Kaiser-Meyer-Olkin (KMO) برای مجموعه داده‌های کلی و اندازه‌گیری KMO برای هر متغیر منفرد (فرض شماره 3).
  • (ج) داده های مناسب برای کاهش با آزمون کرویت بارتلت (فرض شماره 4).
  • (د) انحراف استاندارد نمرات اجزاء برای بررسی نقاط پرت قابل توجه (فرض 5).

 

پیشنهاد می کنم برای حرفه ای شدن در تحلیل های آماری از دوره spss کیارا آکادمی دیدن کنید. برای استفاده از دوره جامع spss می توانید از لینک زیر استفاده کنید:

آموزش رایگان spss

مرحله 2:

شما باید استخراج اولیه اجزا را بررسی کنید. در این مرحله به تعداد متغیرها مولفه وجود خواهد داشت. شما باید روی مقادیر ویژه اولیه تمرکز کنید تا درک اولیه ای از مؤلفه های اصلی که استخراج کرده اید و این که هر مؤلفه چقدر از واریانس کل را توضیح می دهد به دست آورید.

مرحله 3:

باید تعداد مؤلفه‌های «معنی‌دار» را که می‌خواهید حفظ کنید، تعیین کنید. برای انجام این کار، تعدادی گزینه دارید:

  • (الف) از معیار ارزش ویژه-یک استفاده کنید (پیش‌فرض SPSS Statistics).
  • (ب) از نسبت کل واریانس محاسبه شده استفاده کنید.
  • (ج) از آزمون طرح اسکری استفاده کنید.
  • (د) از معیار تفسیر پذیری استفاده کنید. باید در نظر بگیرید که چرا یکی از این گزینه ها را بر دیگری استفاده می کنید و همچنین پیامدهایی که این انتخاب ها ممکن است برای تعداد مؤلفه های استخراج شده داشته باشند. شما همچنین باید نوع چرخشی را که انتخاب کرده‌اید در نظر بگیرید . اعم از:
    • Varimax
    • Direct Oblimin
    • Quartimax
    • Equamax
    • Promax

مرحله چهارم:

اگر تعداد مؤلفه‌هایی را که در ابتدا توسط SPSS Statistics ارائه شده بود حفظ نکرده باشید (به عنوان مثال، بر اساس معیار ارزش ویژه یک، که پیش‌فرض آمار SPSS است، که در مرحله 3 ذکر شد)، باید این کار را انجام دهید. استخراج عامل اجباری با استفاده از آمار SPSS. این به سادگی شامل تعدادی از مراحل اضافی است که در آن به آمار SPSS دستور می دهید تعداد خاصی از مؤلفه ها را حفظ کند (یعنی تعداد مؤلفه هایی که بر اساس انتخاب های خود در مرحله 3 بالا به آنها رسیده اید). سپس باید داده های خود را بر این اساس مجدداً تجزیه و تحلیل کنید (یعنی آمار SPSS بر اساس معیارهای جدید شما اعداد جدیدی را در اختیار شما قرار می دهد).

آموزش تحلیل عاملی تاییدی

مرحله پنجم:

باید راه حل نهایی و چرخشی را تفسیر کنید. برای انجام این کار، شما باید خروجی نهایی (تجدید شده) Total Variance Explained را از آمار SPSS و ماتریس Rotated Components تفسیر کنید.

مرحله ششم:

اکنون در موقعیتی هستید که می توانید نتایج خود را گزارش دهید. این باید شامل تمام تصمیم‌های مرتبطی باشد که در طول تجزیه و تحلیل خود گرفته‌اید (به عنوان مثال، معیارهایی که برای استخراج مؤلفه‌ها استفاده کرده‌اید، نوع چرخش شما و غیره). این امر به ویژه در PCA مهم است زیرا قضاوت های ذهنی زیادی در طول مسیر انجام می شود که همه آنها می توانند به نتایج متفاوتی از داده های مشابه منجر شوند.

مرحله هفتم:

در نهایت، پس از تکمیل تجزیه و تحلیل اصلی خود، اغلب می خواهید برای هر شرکت کننده امتیازی به هر جزء اختصاص دهید. برای مثال، بر اساس مثالی که در این راهنما استفاده کردیم، سؤالات مربوط به انگیزه به شدت در مؤلفه 1 بارگذاری شده است، بنابراین ممکن است بخواهید امتیازی داشته باشید که «انگیزه» یک فرد را منعکس کند. همچنین ممکن است بخواهید از این امتیازها برای تجزیه و تحلیل های بیشتر، مانند رگرسیون چندگانه استفاده کنید.

آموزش جامع spss

منبع برای مطالعه بیشتر تحلیل مؤلفه‌ های اصلی:

Principal Components Analysis (PCA) using SPSS Statistics 

محمد صادق کیانی
محمد صادق کیانی
روانشناس سازمانی و تحلیلگر آماری

6 پاسخ

  1. با سلام. بنظرم آنچه توضیح دادید در مورد تجزیه عاملی اکتشافی بود نه تجزیه به مولفه های اصلی. من برای یکسرس از دادها هم با مینی تب و هم با نرم افزار SAS و هم با روشی که شما توضیح دادید تجزیه به مولفه های اصلی را انجام دادم. نتایج مینی تب و SAS مشابه بود ولی نتایج SPSS متفاوت بوده است. بنظرم نرم افزار SPSS نمی تواند PCA را انجام دهد.

  2. با سلام و تشکر از مطالب خوب و ارزشمندتون

    آیا می‌توان با تعداد 6 نمونه آنالیز مؤلفه‌های اصلی را اجرا کرد؟ اگر بله چگونه؟ اگر خیر تعداد نمونه باید چقدر باشد؟

    1. سلام مرسی

      بر اساس دانش من خیر
      باید بین 250 تا 300 مورد باشد
      بر اساس نمونه هایی که می توانید در گوگل اسکولار سرچ کنید می توانید بسیاری از اطلاعات را بدست آورید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *