اگر داده ها به طور نرمال توزیع نشده باشند، نمی توان از روش های پارامتریک استفاده کرد و باید از آزمون های ناپارامتریک استفاده کرد. آزمون های ناپارامتریک فرض نمی کنند که داده ها به طور نرمال توزیع شده اند. در این مقاله قصد دارم به آموزش تست نرمال بودن متغیرها با نرم افزار JASP بپردازم. تا انتهای این مقاله همراه کیارا آکادمی باشید تا آموزش نرم افزار JASP را به صورت کاربردی دریافت نمایید.
تست نرمال بودن متغیرهای برای رساله
یکی از رایج ترین فرضیات برای آزمون های آماری این است که داده های مورد استفاده به طور نرمال توزیع شده اند. به عنوان مثال، اگر می خواهید یک آزمون t یا یک تحلیل واریانس را اجرا کنید، ابتدا باید آزمایش کنید که آیا داده ها یا متغیرها به طور معمول توزیع شده اند یا خیر. فرض توزیع نرمال نیز برای تحلیل رگرسیون خطی مهم است، اما در این مورد مهم است که خطای ایجاد شده توسط مدل به طور نرمال توزیع شود، نه خود داده ها.
توزیع نرمال چگونه آزمایش می شود؟
توزیع نرمال را می توان به صورت تحلیلی (آزمون های آماری) یا گرافیکی آزمایش کرد. رایج ترین تست های تحلیلی برای بررسی توزیع نرمال داده ها عبارتند از:
- تست کولموگروف اسمیرنوف
- تست شاپیرو ویک
- تست اندرسون-دارلینگ
تست نرمال بودن در JASP
برای شروع می توانید از بخش آمار توصیفی متغیرهای خودتان را وارد کنید:
اکنون کافی است از بین گزینه ها ، گزینه شاپیرو ویک را فعال کنید:
همین طور شما می توانید به راحتی از بخش چک کردن مفروضه ها در تمامی تحلیل های آماری از هر بخش دیگری هم ازمون نرمالیتی را در جسپ فعال کنید. مثلا من در بخش آزمون های تی مستقل گزینه شاپیرو ویک را فعال می کنم:
بلافاصله خروجی ارایه شد:
همین طور از بخش ازمون مفروضه ها در همبستگی هم می توانید این آزمون را فعال کنید:
برای تایید گرافیکی، از هیستوگرام یا بهتر از نمودار Q-Q استفاده می شود. Q-Q مخفف نمودار چندک است، که در آن توزیع واقعی مشاهده شده با توزیع نظری مورد انتظار مقایسه می شود.
آزمون های آماری برای توزیع نرمال
برای آزمایش تحلیلی داده های خود برای توزیع نرمال، چندین روش تست وجود دارد که شناخته شده ترین آن ها آزمون کولموگروف-اسمیرنوف، آزمون شاپیرو-ویلک و آزمون اندرسون دارلینگ است. در تمام این تست ها، شما در حال آزمایش این فرضیه صفر هستید که داده های شما به طور معمول توزیع شده اند. فرضیه صفر این است که توزیع فراوانی داده های شما به طور معمول توزیع شده است. برای رد یا عدم رد فرضیه صفر، تمام این آزمون ها به شما یک مقدار p می دهند. آنچه مهم است این است که آیا این مقدار p کمتر یا بیشتر از 0.05 باشد.
آزمون فرضیه صفر برای نرمال بودن: اگر مقدار p کمتر از 0.05 باشد، این به عنوان یک انحراف قابل توجه از توزیع نرمال تفسیر می شود و می توان فرض کرد که داده ها به طور نرمال توزیع نشده اند. اگر مقدار p بزرگتر از 0.05 باشد و بخواهید از نظر آماری تمیز باشید، لزوما نمی توانید بگویید که توزیع فرکانس نرمال است، فقط نمی توانید فرضیه صفر را رد کنید. در عمل، توزیع نرمال برای مقادیر بیشتر از 0.05 در نظر گرفته می شود، اگر چه این کاملاً صحیح نیست. با این وجود، راه حل گرافیکی همیشه باید در نظر گرفته شود.
نکته: از آزمون کولموگروف-اسمیرنوف و آزمون اندرسون-دارلینگ نیز می توان برای آزمایش توزیع هایی غیر از توزیع نرمال استفاده کرد. |
معایب آزمون های تحلیلی برای توزیع نرمال
متأسفانه روش تحلیلی دارای یک ایراد اساسی است و به همین دلیل است که بیشتر به روش های گرافیکی توجه می شود. مشکل این است که مقدار p محاسبه شده تحت تأثیر اندازه نمونه است. بنابراین، اگر شما یک نمونه بسیار کوچک دارید، مقدار p شما ممکن است بسیار بزرگتر از 0.05 باشد، اما اگر یک نمونه بسیار بسیار بزرگ از همان جامعه داشته باشید، مقدار p شما ممکن است کوچکتر از 0.05 باشد.
اگر فرض کنیم که توزیع در جامعه فقط کمی از توزیع نرمال انحراف داشته باشد، یک مقدار p بسیار بزرگ با یک نمونه بسیار کوچک به دست خواهیم آورد و بنابراین فرض می کنیم که داده ها به طور معمول توزیع شده اند.
با این حال، اگر نمونه بزرگتری بگیرید، مقدار p کوچکتر و کوچکتر می شود، حتی اگر نمونه ها از یک جامعه با توزیع یکسان باشند. با یک نمونه بسیار بزرگ، حتی می توانید مقدار p کمتر از 0.05 را بدست آورید و فرضیه صفر توزیع نرمال را رد کنید. برای جلوگیری از این مشکل، روش های گرافیکی به طور فزاینده ای مورد استفاده قرار می گیرند.
تست گرافیکی برای توزیع نرمال
اگر توزیع نرمال به صورت گرافیکی آزمایش شود، به هیستوگرام یا حتی بهتر به نمودار QQ نگاه می کنیم. اگر می خواهید توزیع نرمال را با استفاده از هیستوگرام بررسی کنید، توزیع نرمال را روی هیستوگرام داده های خود رسم کنید و بررسی کنید که منحنی توزیع داده ها تقریباً با منحنی توزیع نرمال مطابقت دارد.
تست نرمال بودن با هیستوگرام
یک راه بهتر برای انجام این کار استفاده از نمودار چندک یا به اختصار نمودار Q-Q است.شما می توانید با نمودار هیستوگرام به راحتی به بررسی توزیع متغیرها بپردازید.
تست نرمال بودن با QQ-Plot
اگر داده ها کاملاً نرمال توزیع شوند، همه نقاط روی خط قرار می گیرند. هر چه داده ها از خط بیشتر منحرف شوند، داده ها به طور معمول کمتر توزیع می شوند. قبل از هر چیزی پیشنهاد می دهم در دوره آموزش تحلیل آماری با نرم افزار جسپ (JASP) شرکت کنید. برای مشاهده دوره کافی است روی لینک زیر کلیک فرمایید: