آزمون نرمالیتی (بررسی نرمال بودن داده ها)

spss-friedman-test-non-normality-histogram

آزمون نرمالیتی (بررسی نرمال بودن داده ها)

گام اول

در کادر محاوره ای که باز می شود متغیر هایی که می خواهید چولگی و کشیدگی آن را آزمون کنید را به کادر سفید انتقال دهید. سپس روی کلید options کلیک کنید و در کادر محاوره ی آن گزینه های Skewness و kurtosis را فعال کنید.

1

چولگی برابر با گشتاور سوم نرمال شده است. چولگی در حقیقت معیاری از وجود یا عدم تقارن تابع توزیع می باشد. برای یک توزیع کاملاً متقارن چولگی صفر و برای یک توزیع نا متقارن با کشیدگی به سمت مقادیر بالاتر چولگی مثبت و برای توزیع نا متقارن با کشیدگی به سمت مقادیر کوچکتر مقدار چولگی منفی است. در شکل زیر چولگی مثبت و منفی را می بینید.

2

کشیدگی یا کورتزیس نشان دهنده قله‌مندی یک توزیع است. مقدار کشیدگی را با گشتاور چهارم نرمال بر آورد کرده اند، به عبارت دیگر کشیدگی معیاری از تیزی منحنی در نقطه ماکزیمم است و مقدار کشیدگی برای توزیع نرمال برابر ۳ می باشد. کشیدگی مثبت یعنی قله ی توزیع مورد نظر از توزیع نرمال بالاتر و کشیدگی منفی نشانه ی پایین تر بودن قله از توزیع نرمال است.در حالت کلی معمولا چنان چه چولگی و کشیدگی در بازه ی (2 ، 2-) نباشند داده ها از توزیع نرمال بسیار دور بوده و می بایست قبل از هر گونه آزمونی که برای انجامشان باید فرض نرمال بودن داده ها برقرار باشند؛ اصلاح گردند.

گام دوم

پس از بررسی عادی یا نرمال بودن کشیدگی و یا چولگی توزیع داده هایتان، به سراغ آزمون شاپیرو ویلک بروید تا از نرمال بودن داده هایتان مطمئن گردید. برای این کار از مسیر زیر وارد کادر محاوره ی زیر شود.

3

در مثال بالا همان دو متغیر سن age و los را مطابق شکل وارد لیست متغیر های وابسته کنید و سایر جاها را خالی بگذارید. سپس  به منوی plots رفته و گزینه ی Normality plots with tests را تیک دار کنید.

4

با این عمل خروجی شما شامل جدولی است تحت عنوان Tests of Normality که به شما دو مقدار سطح معناداری را برای هر کدام از متغیر ها به طور مجزا می دهد. این مقادیر در تشخیص نرمالیتی داده ها بسیار تعیین کننده است.

5

معمولا چنانچه سطح معناداری در آزمون Shapiro-Wilk که در این جدول با sig. نمایش داده می شود بیشتر از 0.05 باشد می توان داده ها را با اطمینان بالایی نرمال فرض کرد.  در غیر این صورت نمی توان گفت که داده ها توزیعشان نرمال است. با توجه به جدول فوق و مقادیر سطح معناداری برای متغیرهای age و los می توان گفت که توزیع متغیر los می تواند با احتمال خوبی نرمال باشد اما همان طوری که در گام اول هم پیش بینی کرده بودیم متغیر age نرمال نخواهد بود.

بد نیست نگاهی هم به سطح معناداری بخش Kolmogotov-Smirnov داشته باشیم هرچند این آزمون بیشتر برای مجموعه داده هایی با حجم بالا کاربرد دارد.