در این آموزش همراه کیارا آکادمی باشید تا به صورت کاربردی تحلیل مولفه های اصلی (PCA) با SPSS را بیاموزید.
آموزش تجزیه و تحلیل مؤلفه های اصلی
این روش که به اختصار PCA نیز گفته می شود یک تکنیک کاهش متغیر است که شباهت های زیادی به تحلیل عاملی اکتشافی دارد. هدف تحلیل مؤلفههای اصلی کاهش مجموعه بزرگتری از متغیرها به مجموعهای کوچکتر از متغیرهای «مصنوعی» است که «مؤلفههای اصلی» نامیده میشوند، که بیشتر واریانس متغیرهای اصلی را تشکیل میدهند.
کاربرد تحلیل مؤلفه های اصلی
تعدادی کاربرد متداول برای PCA وجود دارد:
- (الف) شما متغیرهای زیادی را اندازه گیری کرده اید (به عنوان مثال، 7-8 متغیر، که به صورت 7-8 سوال یا گزاره در یک پرسشنامه نشان داده شده است) و معتقدید که برخی از متغیرها یکسان را اندازه گیری می کنند. ساختار زمینه ای (به عنوان مثال، افسردگی). اگر این متغیرها همبستگی بالایی دارند، ممکن است بخواهید فقط آن دسته از متغیرها را در مقیاس اندازه گیری خود بگنجانید (مثلاً پرسشنامه شما) که احساس می کنید بیشتر نمایانگر سازه هستند و بقیه را حذف کنید.
- (ب) میخواهید مقیاس اندازهگیری جدیدی ایجاد کنید (مثلاً یک پرسشنامه)، اما مطمئن نیستید که آیا همه متغیرهایی که وارد کردهاید، ساختار مورد علاقهتان را اندازهگیری میکنند (مثلاً افسردگی). بنابراین، آزمایش میکنید که آیا ساختاری که در حال اندازهگیری «بار» روی همه (یا فقط برخی) متغیرهایتان هستید یا خیر. این به شما کمک می کند بفهمید که آیا برخی از متغیرهایی که انتخاب کرده اید به اندازه کافی معرف سازه مورد نظر شما نیستند و باید از مقیاس اندازه گیری جدید حذف شوند.
- (ج) میخواهید آزمایش کنید که آیا مقیاس اندازهگیری موجود (مثلاً یک پرسشنامه) میتواند کوتاه شود تا شامل موارد کمتری باشد (مثلاً سؤالات یا گزارهها)، شاید به این دلیل که چنین مواردی ممکن است اضافی باشند (یعنی ممکن است بیش از یک آیتم در حال اندازهگیری باشند. همان ساختار) و یا ممکن است تمایل به ایجاد مقیاس اندازه گیری وجود داشته باشد که احتمال تکمیل آن بیشتر است (یعنی نرخ پاسخ در پرسشنامه های کوتاه تر بیشتر است). این ها تنها برخی از کاربردهای رایج PCA هستند. همچنین شایان ذکر است که در حالی که PCA از نظر مفهومی با تحلیل عاملی متفاوت است، در عمل اغلب به جای تحلیل عاملی استفاده می شود و در “رویه عامل” در SPSS گنجانده شده است.
مفروضات تحلیل مؤلفه های اصلی
هنگامی که تصمیم می گیرید داده های خود را با استفاده از PCA تجزیه و تحلیل کنید، بخشی از فرآیند شامل بررسی می شود تا مطمئن شوید که داده هایی که می خواهید تجزیه و تحلیل کنید واقعاً می توانند با استفاده از PCA تجزیه و تحلیل شوند. شما باید این کار را انجام دهید زیرا تنها زمانی استفاده از PCA مناسب است که دادههای شما از چهار فرضی که برای PCA لازم است تا نتیجه معتبری به شما ارائه دهد:
فرض شماره 1:
شما چندین متغیر دارید که باید در سطح پیوسته اندازه گیری شوند (اگرچه از متغیرهای ترتیبی بسیار استفاده می شود). نمونه هایی از متغیرهای پیوسته (یعنی متغیرهای نسبت یا فاصله) شامل زمان بازبینی (اندازه گیری شده بر حسب ساعت)، هوش (اندازه گیری شده با استفاده از نمره IQ)، عملکرد امتحان (اندازه گیری از 0 تا 100)، وزن (اندازه گیری شده بر حسب کیلوگرم) و غیره است. نمونههایی از متغیرهای ترتیبی که معمولاً در PCA استفاده میشوند شامل طیف گستردهای از مقیاسهای لیکرت هستند (مثلاً مقیاس ۷ درجهای از «کاملاً موافقم» تا «کاملاً مخالفم»؛ یک مقیاس ۵ درجهای از «هرگز» تا «همیشه»؛ مقیاس 7 درجه ای از “اصلا” تا “خیلی زیاد”؛ مقیاس 5 امتیازی از “مهم نیست” تا “بسیار مهم”).
فرض شماره 2:
باید یک رابطه خطی بین همه متغیرها وجود داشته باشد. دلیل این فرض این است که یک PCA بر اساس ضرایب همبستگی پیرسون است و به این ترتیب، باید یک رابطه خطی بین متغیرها وجود داشته باشد. در عمل، با استفاده از داده های ترتیبی برای متغیرها، این فرض تا حدودی آرام می شود (حتی اگر نباید باشد). اگرچه خطی بودن را می توان با استفاده از یک نمودار پراکنده ماتریسی آزمایش کرد، اما اغلب این امر بیش از حد در نظر گرفته می شود زیرا نمودار پراکندگی گاهی اوقات می تواند بیش از 500 رابطه خطی داشته باشد. به این ترتیب، پیشنهاد می شود که به طور تصادفی فقط چند رابطه ممکن بین متغیرها را انتخاب کنید و آن ها را آزمایش کنید. شما می توانید خطی بودن را در SPSS با استفاده از نمودارهای پراکنده بررسی کنید، و در مواردی که روابط غیر خطی وجود دارد، سعی کنید آن ها را تغییر دهید.
فرض شماره 3:
شما باید کفایت نمونه برداری داشته باشید، به این معنی که برای PCA برای ایجاد یک نتیجه قابل اعتماد، اندازه نمونه به اندازه کافی بزرگ مورد نیاز است. بسیاری از قوانین سرانگشتی مختلف پیشنهاد شده است. اینها عمدتاً بسته به اینکه حجم نمونه مطلق پیشنهاد شده باشد یا مضربی از تعداد متغیرهای نمونه شما استفاده شده باشد، متفاوت است. به طور کلی حداقل 150 مورد یا 5 تا 10 مورد در هر متغیر به عنوان حداقل حجم نمونه توصیه شده است.
چند روش برای تشخیص کفایت نمونه گیری در PCA وجود دارد:
- اندازهگیری کفایت نمونهگیری Kaiser-Meyer-Olkin (KMO) برای مجموعه دادههای کلی
- اندازه گیری KMO برای هر متغیر مجزا
فرض شماره 4:
داده های شما باید برای کاهش داده ها مناسب باشند. به طور موثر، شما باید همبستگی کافی بین متغیرها داشته باشید تا متغیرها به تعداد اجزای کمتری کاهش یابند. روشی که توسط SPSS Statistics برای تشخیص این مورد استفاده می شود، آزمون Bartlett’s test of sphericity است.
شاخص های برازش مدل معادلات ساختاری
فرض شماره 5:
هیچ نقطه پرت قابل توجهی نباید وجود داشته باشد. موارد پرت مهم هستند زیرا می توانند تأثیر نامتناسبی بر نتایج شما داشته باشند. آمار SPSS توصیه می کند که نقاط پرت را به عنوان نمرات مؤلفه های بیشتر از 3 انحراف استاندارد با فاصله از میانگین تعیین کنید.
با استفاده از SPSS می توانید فرضیات 2، 3، 4 و 5 را بررسی کنید.
اجرای تحلیل مؤلفه های اصلی (PCA) در SPSS
یک کارشناس منابع انسانی می خواهد کارمندانی را برای سازمان استخدام کند و به دنبال کسی است که سطوح بالایی از اعتماد را نشان دهد. به منظور انتخاب داوطلبان برای مصاحبه، او پرسشنامه ای مشتمل بر 12 سوال از مقیاس اعتماد سازمانی تهیه کرده (خود او این مقیاس را طراحی کرده تا اعتماد سازمانی کاندیدهای ایرانی را بسنجد) که به نظر او می تواند به این پرسشنامه پاسخ دهد که آیا کاندیداهای درستی دارد یا خیر؟ وی این پرسشنامه را برای 204 داوطلب بالقوه استخدام اجرا کرد. اکنون زمان بررسی تحلیل مؤلفههای اصلی است. برای این کار ابتدا باید از بخش Analyze گزینه Dimension Reduction را انتخاب کنید و بر روی Factor کلیک کنید.
در گام بعدی باید سوالات مقیاس اعتماد را وارد تحلیل کنید (در قسمت Variables).
سپس باید بر روی گزینه Descriptives کلیک کنید و از قسمت Statistics گزینهی Initial solution و از قسمت Correlation Matrix گزینههای Coefficients و KMO and Bartlett’s test of sphericity و Reproduced و Anti-image را انتخاب کنید و در پایان Continue کلیک کنید.
در مرحله بعدی باید به بخش Extraction بروید و گزینه Scree plot را در بخش Display فعال کنید. روی Continue کلیک کنید.
در گام بعدی باید به بخش Rotation بروید و از قسمت Method دوران Varimax را انتخاب و از بخش Display نیز باید دو گزینه Rotated solution و گزینه Loading plot(s) را فعال کنید و سپس روی Continue کلیک کنید.
سپس باید به بخش Factor Analysis: Factor Scores بروید و گزینه Save as variables را فعال کنید.
در گام بعدی باید به بخش Options بروید و در قسمت Coefficient Display Format گزینه Supperss absolute values less than و گزینه Sorted by size را انتخاب کنید. بعد از فعال شدن این گزینه یک کادر در رو به روی آن فعال می شود که شما باید عدد 0/3 را در آن تایپ کنید. روش مواجهه با داده های گم شده را نیز در بخش Missing Values باید به حالت پیش فرض باقی بماند. روی Continue کلیک کنید و در پایان گزینه ok را بزنید.
تفسیر خروجی ها تجزیه و تحلیل اجزای اصلی
خروجی تولید شده توسط SPSS بسیار گسترده است و می تواند اطلاعات زیادی در مورد تجزیه و تحلیل شما ارائه دهد. با این حال، اغلب متوجه می شوید که تجزیه و تحلیل هنوز کامل نشده است و باید قبل از رسیدن به راه حل نهایی، آنالیز آماری بالا را احتمالاً بیش از یک بار مجدداً اجرا کنید.
مرحله شماره 1:
شما باید نتایج حاصل از آزمون های فرضی خود را تفسیر کنید تا مطمئن شوید که می توانید از PCA برای تجزیه و تحلیل داده های خود استفاده کنید. این شامل تجزیه و تحلیل موارد زیر است:
- (الف) نمودارهای پراکندگی که باید برای بررسی خطی بودن متغیرهای خود ایجاد می کردید (فرض شماره 2).
- (ب) کفایت نمونهگیری، بر اساس اندازهگیری کفایت نمونهگیری Kaiser-Meyer-Olkin (KMO) برای مجموعه دادههای کلی و اندازهگیری KMO برای هر متغیر منفرد (فرض شماره 3).
- (ج) داده های مناسب برای کاهش با آزمون کرویت بارتلت (فرض شماره 4).
- (د) انحراف استاندارد نمرات اجزاء برای بررسی نقاط پرت قابل توجه (فرض 5).
پیشنهاد می کنم برای حرفه ای شدن در تحلیل های آماری از دوره spss کیارا آکادمی دیدن کنید. برای استفاده از دوره جامع spss می توانید از لینک زیر استفاده کنید:
مرحله 2:
شما باید استخراج اولیه اجزا را بررسی کنید. در این مرحله به تعداد متغیرها مولفه وجود خواهد داشت. شما باید روی مقادیر ویژه اولیه تمرکز کنید تا درک اولیه ای از مؤلفه های اصلی که استخراج کرده اید و این که هر مؤلفه چقدر از واریانس کل را توضیح می دهد به دست آورید.
مرحله 3:
باید تعداد مؤلفههای «معنیدار» را که میخواهید حفظ کنید، تعیین کنید. برای انجام این کار، تعدادی گزینه دارید:
- (الف) از معیار ارزش ویژه-یک استفاده کنید (پیشفرض SPSS Statistics).
- (ب) از نسبت کل واریانس محاسبه شده استفاده کنید.
- (ج) از آزمون طرح اسکری استفاده کنید.
- (د) از معیار تفسیر پذیری استفاده کنید. باید در نظر بگیرید که چرا یکی از این گزینه ها را بر دیگری استفاده می کنید و همچنین پیامدهایی که این انتخاب ها ممکن است برای تعداد مؤلفه های استخراج شده داشته باشند. شما همچنین باید نوع چرخشی را که انتخاب کردهاید در نظر بگیرید . اعم از:
- Varimax
- Direct Oblimin
- Quartimax
- Equamax
- Promax
مرحله چهارم:
اگر تعداد مؤلفههایی را که در ابتدا توسط SPSS Statistics ارائه شده بود حفظ نکرده باشید (به عنوان مثال، بر اساس معیار ارزش ویژه یک، که پیشفرض آمار SPSS است، که در مرحله 3 ذکر شد)، باید این کار را انجام دهید. استخراج عامل اجباری با استفاده از آمار SPSS. این به سادگی شامل تعدادی از مراحل اضافی است که در آن به آمار SPSS دستور می دهید تعداد خاصی از مؤلفه ها را حفظ کند (یعنی تعداد مؤلفه هایی که بر اساس انتخاب های خود در مرحله 3 بالا به آنها رسیده اید). سپس باید داده های خود را بر این اساس مجدداً تجزیه و تحلیل کنید (یعنی آمار SPSS بر اساس معیارهای جدید شما اعداد جدیدی را در اختیار شما قرار می دهد).
مرحله پنجم:
باید راه حل نهایی و چرخشی را تفسیر کنید. برای انجام این کار، شما باید خروجی نهایی (تجدید شده) Total Variance Explained را از آمار SPSS و ماتریس Rotated Components تفسیر کنید.
مرحله ششم:
اکنون در موقعیتی هستید که می توانید نتایج خود را گزارش دهید. این باید شامل تمام تصمیمهای مرتبطی باشد که در طول تجزیه و تحلیل خود گرفتهاید (به عنوان مثال، معیارهایی که برای استخراج مؤلفهها استفاده کردهاید، نوع چرخش شما و غیره). این امر به ویژه در PCA مهم است زیرا قضاوت های ذهنی زیادی در طول مسیر انجام می شود که همه آنها می توانند به نتایج متفاوتی از داده های مشابه منجر شوند.
مرحله هفتم:
در نهایت، پس از تکمیل تجزیه و تحلیل اصلی خود، اغلب می خواهید برای هر شرکت کننده امتیازی به هر جزء اختصاص دهید. برای مثال، بر اساس مثالی که در این راهنما استفاده کردیم، سؤالات مربوط به انگیزه به شدت در مؤلفه 1 بارگذاری شده است، بنابراین ممکن است بخواهید امتیازی داشته باشید که «انگیزه» یک فرد را منعکس کند. همچنین ممکن است بخواهید از این امتیازها برای تجزیه و تحلیل های بیشتر، مانند رگرسیون چندگانه استفاده کنید.
منبع برای مطالعه بیشتر تحلیل مؤلفه های اصلی:
6 پاسخ
سلام خیلی عالی بود مرسی
مرسی از شما
با سلام. بنظرم آنچه توضیح دادید در مورد تجزیه عاملی اکتشافی بود نه تجزیه به مولفه های اصلی. من برای یکسرس از دادها هم با مینی تب و هم با نرم افزار SAS و هم با روشی که شما توضیح دادید تجزیه به مولفه های اصلی را انجام دادم. نتایج مینی تب و SAS مشابه بود ولی نتایج SPSS متفاوت بوده است. بنظرم نرم افزار SPSS نمی تواند PCA را انجام دهد.
سلام مرسی از این که تجربه خودتون را به اشتراک گذاشتید
از منبع انگلیسی که گذاشته شده در مقاله هم استفاده کنید
ببنید آیا تفاوتی دارد؟
با سلام و تشکر از مطالب خوب و ارزشمندتون
آیا میتوان با تعداد 6 نمونه آنالیز مؤلفههای اصلی را اجرا کرد؟ اگر بله چگونه؟ اگر خیر تعداد نمونه باید چقدر باشد؟
سلام مرسی
بر اساس دانش من خیر
باید بین 250 تا 300 مورد باشد
بر اساس نمونه هایی که می توانید در گوگل اسکولار سرچ کنید می توانید بسیاری از اطلاعات را بدست آورید