جستجو کردن
Close this search box.

آموزش آزمون تی در R: آزمون T تک نمونه ای و مستقل و تی وابسته

آموزش آزمون تی در R: آزمون T تک نمونه ای و مستقل و تی وابسته
فهرست مطالب

در این مقاله قصد دارم به آموزش آزمون تی در R شامل آزمون تی تک نمونه ای و تی مستقل و تی وابسته بپردازم. تا انتهای این مقاله همراه کیارا آکادمی باشید تا آموزش نرم افزار R را به صورت کاربردی دریافت نمایید.

آزمون تی در R

بگذارید ابتدا نکات نظری مهم را برای شما مطرح کنم:

استنباط آماری چیست؟

استنتاج آماری هنر نتیجه گیری در مورد توزیع داده ها است. یک دانشمند داده اغلب در معرض سؤالاتی قرار می گیرد که فقط می توان به آن ها پاسخ علمی داد. بنابراین، استنتاج آماری یک استراتژی برای آزمایش درستی یک فرضیه، یعنی تایید شده توسط داده ها است. یک استراتژی رایج برای ارزیابی فرضیه، انجام آزمون t است. آزمون t می تواند نشان دهد که آیا دو گروه دارای میانگین یکسانی هستند یا خیر؟ آزمون t را می توان برای موارد زیر تخمین زد:

  1. یک بردار منفرد (یعنی آزمون t تک نمونه ای)
  2. دو بردار از یک گروه نمونه (یعنی آزمون t زوجی)

شما فرض کنید که هر دو بردار به صورت تصادفی، مستقل و از یک جمعیت توزیع شده نرمال با واریانس های ناشناخته اما مساوی هستند.

T-Test در R

ایده اصلی پشت آزمون تی استفاده از آمار برای ارزیابی دو فرضیه مخالف است:

  • H0: فرضیه NULL: میانگین همان نمونه مورد استفاده است
  • H1: فرضیه درست: میانگین با نمونه مورد استفاده متفاوت است

آزمون T معمولاً با حجم نمونه کوچک استفاده می شود. برای انجام آزمون t، باید نرمال بودن داده ها را فرض کنید.

کد T-Test در R

نحو اصلی برای t.test در R این گونه است:

t.test(x, y = NULL,
mu = 0، var.equal = FALSE)

تحلیل این خط کد را در زیر آورده ام:

  • x : بردار برای محاسبه آزمون t تک نمونه ای
  • y: بردار دومی برای محاسبه دو گروه
  • mu: میانگین نمونه
  • var.equal: مشخص کنید که آیا واریانس دو بردار برابر است یا خیر؟ به طور پیش فرض، روی “FALSE” تنظیم کنید

آزمون تی مستقل در R

اول بگویم که کل کدهایی که باید برای این تحلیل استفاده کنید را یک جا برایتان نوشته ام:

library(haven)
data <- read_sav(“C:/Users/kiaraacademy/Desktop/data/data.sav”)
View(data)
library(rstatix)
group1 <- c(30, 30, 40, 35, 60, 60, 40, 45, 45)
group2 <- c(60, 50, 60, 70, 62, 70, 67, 70, 55,63,88,30)
boxplot(group1,group2,col = c(31,5),names=c(“group1″,”group2”))
var.test(group1,group2)
t.test(group1,group2,paired = FALSE,var.equal = TRUE ,alternative = “less”)

حال برویم برای تحلیل تک تک این خط کدها:

در گام اول باید کتاب خانه را نصب نمایید:

آموزش آزمون تی در R: آزمون T تک نمونه ای و مستقل و تی وابسته

در گام بعدی باید کتاب خانه rstatix را اجرا نمایید (البته بعد از این که دیتا خود را وارد نرم افزار کردید):

library(haven)
data <- read_sav(“C:/Users/kiaraacademy/Desktop/data/data.sav”)
View(data)

حالا من جدای از دیتا فریم برای این که راحت تر اموزش بدهم دو گروه بررسی خودم را تحت عنوان گروه 1 و گروه 2 در اینجا برای شما آورده ام و هر دو را اجرا کردم.

group1 <- c(30, 30, 40, 35, 60, 60, 40, 45, 45)
group2 <- c(60, 50, 60, 70, 62, 70, 67, 70, 55,63,88,30)

من برای بررسی گرافیکی میانگین ها در آزمون تی در R ، یک نمودار جعبه ای ابتدا ترسیم می کنم:

boxplot(group1,group2,col = c(31,5),names=c(“group1″,”group2”))

آموزش آزمون تی در R: آزمون T تک نمونه ای و مستقل و تی وابسته

مفروضه برابری واریانس ها با تست زیر صورت می گیرد. کدهای بالا را بنویسیم:

var.test(group1,group2)

خروجی: همان طور که مشخص است باید p-value = 0.5562 را بررسی کرده که در این آزمون نباید این مقدار برابر باشد که خوشبختانه نیست. اکنون به سراغ اجرای خود آزمون تی مستقل می رویم:

t.test(group1,group2,paired = FALSE,var.equal = TRUE ,alternative = “less”)

خروجی آزمون تی در R: برای تفسیر همان طور که مشخص است p-value = 0.001455 می باشد که کاملا معنی دار است. پس گروه ها با هم تفاوت معنی داری دارند.

تست تی دو نمونه ای در R

حالا بیاییم یک مثال دیگه بزنیم و ان را نیز حل کنیم. در کل گفتم که از آزمون t دو نمونه ای برای آزمایش این که آیا میانگین دو جمعیت برابر هستند یا نه استفاده می شود. می‌توانید از نحو اصلی زیر برای انجام یک آزمون t دو نمونه در R استفاده کنید:

t.test(group1, group2, var.equal=TRUE)

نکته: با مشخص کردن var.equal=TRUE، به R می‌گوییم که واریانس‌ها بین دو نمونه برابر است. اگر نمی‌خواهید این فرض را انجام دهید، به سادگی این آرگومان را کنار بگذارید و R در عوض آزمون t Welch را انجام می‌دهد، که فرض نمی‌کند واریانس‌ها بین نمونه‌ها برابر هستند. مثال زیر نحوه اجرای آزمون t دو نمونه ای در R را در عمل نشان می دهد.

مثال T-Test دو نمونه ای در R

فرض کنید می خواهیم بدانیم که آیا دو گونه مختلف از گیاهان دارای ارتفاع متوسط یکسانی هستند یا خیر. برای آزمایش این، یک نمونه تصادفی ساده از 12 گیاه از هر گونه جمع آوری می کنیم. کد زیر نشان می دهد که چگونه می توان یک آزمون t دو نمونه در R را برای تعیین اینکه آیا میانگین ارتفاع بین دو گونه برابر است انجام داد:

#بردارهایی برای نگهداری ارتفاع گیاهان از هر نمونه ایجاد کنید

group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19)
group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19)

#آزمون t دو نمونه انجام دهید

t.test(group1, group2, var.equal=TRUE)

آموزش آزمون تی در R: آزمون T تک نمونه ای و مستقل و تی وابسته
در اینجا نحوه تفسیر نتایج آزمایش آمده است:

  • داده: نام بردارهایی که حاوی داده های نمونه هستند.
  • t: آماره آزمون t. در این حالت 2.5505- است.
  • df: درجات آزادی که به صورت n1 + n2 – 2 = 12 + 12 – 2 = 22 محاسبه می شود.
  • p-value: p-value که مربوط به آماره آزمون t معادل 2.5505- و df = 22 است. مقدار p 0.01823 است. ما می توانیم این مقدار را با استفاده از ماشین حساب T Score to P Value تایید کنیم.
  • فاصله اطمینان 95 درصد: فاصله اطمینان 95 درصد برای تفاوت واقعی میانگین بین دو گروه. معلوم می شود که [5.59-، 0.575-] است.
  • برآوردهای نمونه: میانگین نمونه هر گروه. در این مورد، میانگین نمونه گروه 1 11.667 و میانگین نمونه گروه 2 14.75 بود.

آزمون کای دو (chi-square) یا خی دو در R

فرضیه های صفر و جایگزین برای این آزمون t دو نمونه خاص به شرح زیر است:

  • H0: µ1 = µ2 (دو میانگین جمعیت برابر هستند)
  • HA: µ1 ≠µ2 (دو میانگین جمعیت برابر نیستند)

چون مقدار p آزمون ما (01823.0) کمتر از 0.05 است، فرض صفر را رد می کنیم. این بدان معناست که ما شواهد کافی برای این نتیجه داریم که میانگین ارتفاع بوته بین دو گونه برابر نیست.

نکته تکمیلی:

تابع t.test در R از کد زیر استفاده می کند:

t.test(x, y, alternative=”two.sided”, mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95)

تحلیل کد بالا:

  • x, y: نام دو بردار حاوی داده ها.
  • جایگزین: فرضیه جایگزین. گزینه‌ها عبارتند از «دو طرفه»، «کمتر» یا «بزرگتر».
  • mu: مقدار فرض شده تفاوت واقعی در میانگین است.
  • paired: اینکه آیا از آزمون t زوجی استفاده شود یا خیر.
  • var.equal: اینکه آیا واریانس ها بین دو گروه برابر است یا نه.
  • conf.level: سطح اطمینان مورد استفاده برای آزمون.

آزمون تی تک نمونه ای در R

آزمون t یک نمونه یا student’s test ، میانگین یک بردار را با میانگین نظری، را با میانگین نمونه فعلی تحقیق مقایسه می‌کند. فرمول مورد استفاده برای محاسبه آزمون t این است:

One Sample T-Test in R

m: به میانگین اشاره دارد
u: میانگین نظری (مثلا میانگین درسی دانش آموزان در بررسی های قبلی)
s: انحراف معیار
n: تعداد مشاهدات

برای ارزیابی اهمیت آماری آزمون t، باید مقدار p را محاسبه کنید. مقدار p از 0 تا 1 متغیر است و به صورت زیر تفسیر می شود:

  • مقدار p کمتر از 0.05 به این معنی است که شما کاملاً مطمئن هستید که فرضیه صفر را رد می کنید، بنابراین H1 پذیرفته می شود.
  • مقدار p بالاتر از 0.05 نشان می دهد که شما شواهد کافی برای رد فرضیه صفر ندارید.

اجرای آزمون تی یک نمونه ای در R

فرض کنید شما در یک مدرسه به بررسی متغیر ترس دانش آموزان از ریاضی می پردازید. شما می خواهید ببینید میانگین ترس افراد از میانگین در بررسی قبلی که در ناحیه دیگری انجام شده تفاوت معنی داری دارد یا نه؟ البته شما می توانید با تابع rnorm یک بردار تصادفی ایجاد کنید. این تابع مقادیر معمولی توزیع شده را تولید می کند. نحو اصلی این است:

rnorm(n, mean, sd)
arguments
– n: Number of observations to generate
– mean: The mean of the distribution. Optional
– sd: The standard deviation of the distribution. Optional

شما می توانید یک توزیع با 30 مشاهده با میانگین 9.99 و انحراف معیار 0.04 ایجاد کنید.

set.seed(123) fear <- rnorm(30, mean = 9.99, sd = 0.04)
head(fear)

برای بررسی این که آیا سطح fear با ترس دانش آموزان از ریاضی در ناحیه دیگر تفاوت دارد یا خیر، می توانید از آزمون تی تک نمونه ای استفاده کنید. می توانید یک آزمون فرضیه ترسیم کنید:

  • H0: میانگین سطح ترس دانش آموزان از ریاضی برابر با 10 است
  • H1: سطح متوسط ترس دانش آموزان از ریاضی با 10 متفاوت است

شما از سطح معنی داری 0.05 استفاده می کنید.

# H0 : mu = 10
t.test(fear, mu = 10)

p-value آزمون t یک نمونه 0.1 و بالاتر از 0.05 است. شما می توانید با 95% اطمینان داشته باشید که میزان ترس بین 9.973 تا 10.002 است. شما نمی توانید فرضیه صفر (H0) را رد کنید. شواهد کافی مبنی بر این که مقدار ترس دانش آموزان از ریاضی اضافه شده وجود ندارد. حالا من هم تصویر کد ها را برای شما می گذارم و سپس کدها را هم برای شما می نویسم:

آموزش آزمون تی در R: آزمون T تک نمونه ای و مستقل و تی وابسته

نحوه انجام یک تست T یک نمونه ای در R

برویم یک مثال دیگر هم بزنیم و آن را حل کنیم. در کل گفتم که برای تعیین این که آیا میانگین یک جامعه با مقداری برابر است یا خیر از آزمون t تک نمونه ای استفاده می شود. می‌توانید از نحو اصلی زیر در R برای انجام یک آزمون t یک نمونه استفاده کنید:

t.test(data, mu=10)

مثال زیر نحوه استفاده از این نحو را در عمل نشان می دهد.

مثال T-Test یک نمونه ای در R

فرض کنید یک گیاه شناس می خواهد بداند که آیا ارتفاع متوسط یک گونه گیاهی برابر با 15 اینچ است یا خیر. او یک نمونه تصادفی ساده از 12 گیاه جمع آوری می کند و هر یک از قد آنها را بر حسب اینچ ثبت می کند. او می تواند از کد زیر برای انجام یک آزمون t یک نمونه در R استفاده کند تا مشخص کند که آیا میانگین ارتفاع برای این گونه گیاه واقعا برابر با 15 اینچ است یا خیر:

#وکتور برای نگهداری ارتفاع گیاهان ایجاد کنید

my_data <- c(14, 14, 16, 13, 12, 17, 15, 14, 15, 13, 15, 14)

#آزمون تی نمونه را انجام دهید

t.test(my_data, mu=15)

مثال T-Test یک نمونه ای در R

در اینجا نحوه تفسیر هر مقدار در خروجی آمده است:

  • داده: نام بردار مورد استفاده در آزمون t. در این مثال از my_data استفاده کردیم.
  • t: آماره آزمون t، محاسبه شده به صورت (x – μ) / (s√n) = (14.333-15)/(1.370689/√12) = -1.6848.
  • df: درجات آزادی که به صورت n-1 = 12-1 = 11 محاسبه می شود.
  • p-value: مقدار p دو دنباله که مربوط به آماره آزمون t برابر با 1.6848- و 11 درجه آزادی است. در این مورد، p = 0.1201.
  • فاصله اطمینان 95 درصد: اطمینان 95 درصد برای میانگین جمعیت واقعی، محاسبه شده است [13.46244، 15.20423].

آموزش محاسبه ضریب تغییرات در R

فرضیه های صفر و جایگزین برای این آزمون t یک نمونه به شرح زیر است:

  • H0: µ = 15 (میانگین ارتفاع این گونه گیاه 15 اینچ است)
  • HA: µ ≠15 (ارتفاع متوسط 15 اینچ نیست)

از آن جایی که مقدار p آزمون ما (0.1201) بزرگتر از 0.05 است، ما در رد فرضیه صفر آزمون ناکام ماندیم. این بدان معناست که ما شواهد کافی نداریم که بگوییم ارتفاع متوسط این گونه گیاهی با 15 اینچ متفاوت است.

آزمون تی وابسته در R

آزمون تی زوجی یا آزمون تی وابسته زمانی استفاده می شود که میانگین گروه تحت درمان دو بار محاسبه شود. کاربرد اصلی آزمون t زوجی:

  1. تست A/B: دو نوع را با هم مقایسه کنید
  2. مطالعات مورد شاهدی: قبل و بعد از درمان

اجرای آزمون تی زوجی در R

به این مثال توجه کنید: یک شرکت علاقه مند به اطلاع از عملکرد یک برنامه فروش است. این شرکت تصمیم گرفت فروش روزانه یکی از فروشگاه های خود را که در آن برنامه در حال تبلیغ است بررسی کند. در پایان برنامه، شرکت می خواهد بداند که آیا تفاوت آماری بین میانگین فروش فروشگاه قبل و بعد از برنامه وجود دارد یا خیر؟

  • این شرکت فروش را هر روز قبل از شروع برنامه پیگیری می کرد. این اولین متغیر می شود که پیش ازمون هم به آن گفته می شود.
  • این برنامه به مدت یک هفته تبلیغ می شود و فروش هر روز ثبت می شود. این بردار دوم ماست.

مشاوره پایان نامه و رساله

شما آزمون t را برای بررسی در مورد اثربخشی برنامه انجام خواهید داد. این آزمون t زوجی نامیده می شود زیرا مقادیر هر دو بردار از توزیع یکسانی (یعنی فروشگاه یکسان) می آیند. آزمون فرضیه عبارت است از:

  1. H0: تفاوتی در میانگین بین پیش آزمون و پس آزمون وجود ندارد
  2. H1: میانگین بین پیش آزمون و پس آزمون متفاوت هستند

یک فرض در آزمون t واریانس برابر است. اما در واقعیت، داده ها به سختی دارای میانگین برابر هستند و منجر به نتایج نادرست برای آزمون t می شود. یکی از راه حل ها برای کاهش فرض واریانس برابر استفاده از آزمون ولش یا همان Welch’s test است. R فرض می کند که دو واریانس به طور پیش فرض برابر نیستند. در دیتافریم شما، هر دو بردار واریانس یکسانی دارند، می توانید var.equal= TRUE را تنظیم کنید. شما با این کد می توانید دو بردار تصادفی از یک توزیع با میانگین بالاتر برای فروش بعد از برنامه ایجاد کنید:

set.seed(123)
# sales before the program
sales_before <- rnorm(7, mean = 50000, sd = 50)

# sales after the program.This has higher mean
sales_after <- rnorm(7, mean = 50075, sd = 50)
# draw the distribution
t.test(sales_before, sales_after,var.equal = TRUE)

آموزش تی وابسته در R

حالا من یک مثال بر اساس دیتا خودم برای شما می زنم. من می خواهم t1 را با t2 مقایسه کنم. ابتدا می آیم و دیتا خودم را در r فراخوانی می کنم:

library(haven)
data <- read_sav(“C:/Users/kiaraacademy/Desktop/data/data.sav”)
View(data)

دقت داشته باشید که کتاب خانه dplyr را هم از قبل نصب کنید که برای توصیف دیتا و…. ازش استفاده خواهیم کرد. برای این که که ببنیم میانگین های گروه ها با هم فرق دارد یا نه بهتر است یک خلاصه ای از دیتا خود بگیریم و آن را بررسی کنیم:

summary(data)

خروجی:

آموزش آزمون تی در R: آزمون T تک نمونه ای و مستقل و تی وابسته

 

در گام بعدی هم باید کد اصلی آزمون تی وابسته را اجرا کنیم:

t.test(data$t1,data$t2, paired=TRUE)

خروجی: بر اساس خروجی بالا باید p-value = 2.98e-05 را نگاه کنید. برای این که عدد را به درستی بخوانید باید 5 صفر قبل از عدد قرار داده و آن را دوباره بررسی کنید. همین طور من اندازه اثر را نیز می خواهم محاسبه کنم. برای این کار اول کل نتایج تی وابسته را در یک متغیر جدید ذخیره کردم و سپس کد دوم را نوشتم:

paired <- t.test(data$t1,data$t2, paired=TRUE)
eta <- paired$statistic^2/(paired$ statistic^2 + 306-1)

در مورد واریانس ها در این آزمون هم باید اشاره کنم:

var.equal= TRUE

اگر واریانس ها را برابر فرض کنیم، باید پارامتر var.equal= TRUE را تغییر دهیم.

آزمون t نمونه های زوجی در R

حالا که تا اینجا آمده ایم بیاییم یک بار دیگر این آزمون را بر روی دیتا دیگری تست کنیم. در کل گفتم که آزمون t-test نمونه‌های زوجی یک آزمون آماری است که میانگین دو نمونه را زمانی که هر مشاهده در یک نمونه می‌تواند با مشاهده در نمونه دیگر جفت شود، مقایسه می‌کند. برای مثال، فرض کنید می‌خواهیم بدانیم که آیا یک برنامه مطالعاتی به طور قابل‌ توجهی بر عملکرد دانش‌آموز در یک امتحان خاص تأثیر می‌گذارد یا خیر. برای آزمایش این، ما 20 دانش آموز در یک کلاس داریم که در یک پیش آزمون شرکت می کنند.

تحلیل آماری

سپس، ما هر یک از دانش آموزان را هر روز به مدت دو هفته در برنامه مطالعه شرکت می کنیم. سپس، دانش‌آموزان در آزمونی با سختی مشابه شرکت می‌کنند. برای مقایسه تفاوت بین میانگین نمرات در آزمون اول و دوم، از آزمون t زوجی استفاده می‌کنیم، زیرا برای هر دانش‌آموز می‌توان نمره اول آزمون او را با نمره آزمون دوم او جفت کرد.

نحوه انجام آزمون t زوجی

برای انجام یک آزمون t زوجی، می توانیم از روش زیر استفاده کنیم:

  • مرحله 1: فرضیه های صفر و جایگزین را بیان کنید.

H0: μd = 0

Ha: μd ≠ 0 (دو جهته)
Ha: μd > 0 (یک جهته)
Ha: μd < 0 (یک جهته)

μd اختلاف میانگین است.

  • مرحله 2: آمار آزمون و مقدار p مربوطه را بیابید. فرض کنید a = نمره دانش آموز در آزمون اول و b = نمره دانش آموز در آزمون دوم. برای آزمون فرضیه صفر که میانگین واقعی تفاوت بین نمرات آزمون صفر است
  • مرحله 3: بر اساس سطح معناداری، فرضیه صفر را رد یا رد کنید. اگر مقدار p کمتر از سطح معناداری انتخابی ما باشد، فرضیه صفر را رد می کنیم و به این نتیجه می رسیم که از نظر آماری تفاوت معنی داری بین میانگین دو گروه وجود دارد. در غیر این صورت، ما نمی توانیم فرضیه صفر را رد کنیم.

نحوه انجام آزمون t زوجی در R

برای انجام یک آزمون t زوجی در R، می‌توانیم از تابع t.test با نحو زیر استفاده کنیم:

t.test(x, y, paired = TRUE, alternative = “two.sided”)
  • x,y: دو بردار عددی که می خواهیم با هم مقایسه کنیم
  • paired: یک مقدار منطقی که مشخص می کند ما می خواهیم یک آزمون t زوجی را محاسبه کنیم
  • جایگزین: فرضیه جایگزین. این را می توان روی “دو طرفه” (پیش فرض)، “بزرگتر” یا “کمتر” تنظیم کرد.

مثال زیر نحوه اجرای یک آزمون t زوجی را نشان می دهد تا مشخص شود که آیا تفاوت معنی داری در میانگین نمرات بین یک پیش آزمون و یک پس آزمون برای 20 دانش آموز وجود دارد یا خیر؟ ابتدا مجموعه داده را ایجاد می کنیم:

#create the dataset
data <- data.frame(score = c(85 ,85, 78, 78, 92, 94, 91, 85, 72, 97, 84, 95, 99, 80, 90, 88, 95, 90, 96, 89, 84, 88, 88, 90, 92, 93, 91, 85, 80, 93, 97, 100, 93, 91, 90, 87, 94, 83, 92, 95),
group = c(rep(‘pre’, 20), rep(‘post’, 20)))

#view the dataset
data

آموزش آزمون تی در R: آزمون T تک نمونه ای و مستقل و تی وابسته

حالا بهتره برای این دیتا و بررسی تفاوت ها نمودار ترسیم کنیم. در مرحله بعد، آمار خلاصه دو گروه را با استفاده از توابع group_by و summarise از کتابخانه dplyr بررسی خواهیم کرد:

#load dplyr library
library(dplyr)

#find sample size, mean, and standard deviation for each group
data %>%
group_by(group) %>%
summarise(count = n(),mean = mean(score),sd = sd(score))

t زوجی

ما همچنین می‌توانیم با استفاده از تابع boxplot در R برای مشاهده توزیع امتیازات برای گروه‌های قبل و بعد، جعبه‌هایی ایجاد کنیم:

boxplot(score~group,data=data,main=”Test Scores by Group”,xlab=”Group”,ylab=”Score”,col=”RED”,border=”black”)

نحوه انجام آزمون t زوجی در R

هم از آمار خلاصه و هم از نمودارهای جعبه می‌توان دریافت که میانگین امتیاز در گروه پست کمی بیشتر از میانگین امتیاز در گروه پیش است. همچنین می بینیم که نمرات گروه پست نسبت به نمرات پیش گروه دارای تنوع کمتری هستند. برای این که بفهمیم تفاوت میانگین این دو گروه از نظر آماری معنی‌دار است یا نه، می‌توان به آزمون t زوجی اقدام کرد.

بررسی مفروضه های آزمون در R

قبل از انجام آزمون t زوجی، باید بررسی کنیم که توزیع تفاوت ها به طور نرمال (یا تقریباً نرمال) توزیع شده است. برای انجام این کار، می‌توانیم بردار جدیدی ایجاد کنیم که به‌عنوان تفاوت بین نمرات قبل و بعد تعریف می‌شود و یک تست shapiro-wilk برای نرمال بودن این بردار مقادیر انجام دهیم:

#define new vector for difference between post and pre scores
differences <- with(data, score[group == “post”] – score[group == “pre”])

#perform shapiro-wilk test for normality on this vector of values
shapiro.test(differences)

تست shapiro-wilk برای نرمال بودن

مقدار p آزمون 0.1135 است که از آلفا = 0.05 بیشتر است. بنابراین، ما نمی‌توانیم فرضیه صفر مبنی بر این که داده‌های ما به طور معمول توزیع شده‌اند را رد کنیم. این بدان معناست که اکنون می‌توانیم آزمون t زوجی را انجام دهیم. برای انجام یک آزمون t زوجی می توانیم از کد زیر استفاده کنیم:

t.test(score ~ group, data = data, paired = TRUE)

 

بررسی مفروضه های آزمون در R

از خروجی می توانیم ببینیم که:

  • آمار آزمون t 1.588 است.
  • مقدار p برای این آمار آزمون با 19 درجه آزادی (df) 0.1288 است.
  • فاصله اطمینان 95% برای تفاوت میانگین (0.6837-، 4.9837) است.
  • میانگین تفاوت بین نمرات گروه قبل و بعد 2.15 است.

بنابراین، از آن جایی که مقدار p ما کمتر از سطح معنی‌داری ما 0.05 است، در رد فرضیه صفر که دو گروه دارای میانگین‌های آماری معنی‌داری هستند، شکست می‌خوریم. به عبارت دیگر، شواهد کافی نداریم که بگوییم میانگین نمرات بین گروه های قبل و بعد از نظر آماری تفاوت معنی داری دارد. این بدان معناست که برنامه مطالعه تأثیر معنی داری بر نمرات آزمون نداشت. علاوه بر این، فاصله اطمینان 95% ما می گوید که ما “95% اطمینان داریم” که تفاوت میانگین واقعی بین دو گروه بین 0.6837- و 4.9837 است. از آن جایی که مقدار صفر در این فاصله اطمینان وجود دارد، به این معنی است که صفر در واقع می تواند تفاوت واقعی بین میانگین امتیازات باشد، به همین دلیل است که ما در رد فرضیه صفر در این مورد شکست خوردیم.

آموزش تست t Welch در R

از آزمون t ولش برای مقایسه میانگین بین دو گروه مستقل استفاده می‌شود، زمانی که فرض نمی‌شود دو گروه دارای واریانس مساوی هستند. برای انجام آزمون t Welch در R، می‌توانیم از تابع t.test استفاده کنیم که از نحو زیر استفاده می‌کند:

t.test(x, y, alternative = c(“two.sided”, “less”, “greater”))

تحلیل کد بالا:

  • x: بردار عددی مقادیر داده برای گروه اول
  • y: بردار عددی مقادیر داده برای گروه دوم
  • جایگزین: فرضیه جایگزین برای آزمون. پیش فرض دو طرفه است.

مثال آزمون t ولش در R

معلمی می خواهد نمرات امتحان 12 دانش آموزی را که از دفترچه آمادگی امتحان برای آماده شدن برای برخی امتحان استفاده کرده اند با 12 دانش آموزی که این کار را نکرده اند مقایسه کند. بردارهای زیر نمرات امتحانات دانش آموزان هر گروه را نشان می دهد:

booklet <- c(90, 85, 88, 89, 94, 91, 79, 83, 87, 88, 91, 90)
no_booklet <- c(67, 90, 71, 95, 88, 83, 72, 66, 75, 86, 93, 84)

قبل از انجام آزمون t ولش، ابتدا می‌توانیم نمودارهای جعبه‌ای برای تجسم توزیع امتیازات برای هر گروه ایجاد کنیم:

boxplot(booklet, no_booklet, names=c(“Booklet”,”No Booklet”))

آموزش تست t Welch در R

ما به وضوح می بینیم که گروه «کتابچه» دارای میانگین نمره بالاتر و واریانس کمتری در نمرات است.  برای اینکه به طور رسمی آزمایش کنیم که آیا میانگین نمرات بین گروه ها تفاوت معنی داری دارند یا خیر، می توانیم آزمون t ولش را انجام دهیم:

#آزمون تی ولش را انجام دهید

t.test(booklet, no_booklet)

تست t Welch در R 1

از خروجی می بینیم که آماره آزمون t برابر با 2.2361 و p-value مربوطه 0.04171 است. از آن جایی که این مقدار p کمتر از 0.05 است، می‌توانیم فرضیه صفر را رد کنیم و نتیجه بگیریم که از نظر آماری تفاوت معنی‌داری در میانگین نمرات امتحان بین دو گروه وجود دارد. تابع t.test نیز اطلاعات زیر را در اختیار ما قرار می دهد:

  • فاصله اطمینان 95% برای تفاوت میانگین نمرات امتحان بین دو گروه [0.3048، 13.8618] است.
  • میانگین نمره آزمون گروه اول 87.91667 است.
  • میانگین نمره آزمون گروه دوم 80.83333 است.

خلاصه آزمون تی

T-Test از خانواده آمار استنباطی است. معمولاً برای یافتن این که آیا تفاوت آماری بین میانگین دو گروه وجود دارد یا خیر استفاده می شود. آزمون t یک نمونه ای، میانگین یک بردار را با میانگین نظری مقایسه می‌کند. آزمون تی زوجی یا آزمون تی نمونه وابسته زمانی استفاده می شود که میانگین گروه تحت درمان دو بار محاسبه شود. می توانیم آزمون t را به صورت جدول زیر خلاصه کنیم:

کد p-value فرضیه آزمون
t.test(x, mu = mean) 0.05 میانگین یک نمونه با میانگین نظری 0.05 متفاوت است. آزمون t تک نمونه ای
t.test(A,B, mu = mean) 0.05  میانگین A با میانگین B برای همان گروه متفاوت است آزمون t نمونه زوجی
t.test(group1,group2,paired = FALSE,var.equal = TRUE ,alternative = “less”) 0.05 میانگین دو گروه مستقل از هم با هم متفاوت است آزمون تی مستقل

منابع بیشتر برای مطالعه آزمون تی در R:

T-Test in R Programming: One Sample & Paired T-Test

How to Perform a One Sample T-Test in R

How to Perform a Two Sample T-Test in R

How to Perform a Paired Samples t-test in R

How to Perform Welch’s t-Test in R

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *