تشریح مفهوم رگرسیون

1 KwdVLH5e_P9h8hEzeIPnTg

تشریح مفهوم رگرسیون

در صورتی که بین متغیرها رابطه وجود داشته باشد، می توان آن را با الگوهای ریاضی بیان کرد. معمولا چنین الگویی ممکن است از نوع خطی یا غیر خطی باشد. اگر بتوان الگوی همبستگی را به صورت یک معادله خط نوشت، به آن معادله رگرسیون خطي می‌گویند.

در رگرسیون هدف آن است که با استفاده از معادله رگرسیون و به کمک يك نمونه تصادفي و بعضی روش های آماری، رفتار متغیر وابسته را با آگاهی از مقادیر و مشخصات متغیرهای مستقل، پیش بینی کنیم.
در رگرسیون خطی ساده اگرy   را متغیر وابسته و x  را متغیر مستقل در نظر بگیریم، می‌توان معادله خط رگرسیون را به صورت زیر نوشت:Y = aX + b

در اين معادلهa   و b  را پارامترهاي خط گفته و مانند هر پارامتر ديگري مي توان آن ها را برآورد كرد.
برآورد كردن پارامترهاي خط رگرسيون: روش هاي متفاوتي براي برآورد كردن دو پارامترa  و b وجود دارد. يكي از اين روش ها، روش «كمترين مربعات خطا» است كه در آن اين دو پارامتر به روش زير برآورد مي‌شود:

1

مثال: با توجه به داده هاي جدول زير، بررسي انجام شده نشان داد بين تعداد سيگار و ساعات خواب افراد سيگاري رابطه وجود دارد. معادله خط رگرسيون را به دست آوريد.
x  = تعداد سيگار متغير مستقل و Y  = ساعات خواب متغير وابسته است.

2

حل: با توجه به داده هاي فوق پارامترهاي خط رگرسيون را برآورد كرده و معادله خط را مي نويسيم.

3

معادله خط رگرسيون به اين صورت است: y = -0/8x + 8/6

در رگرسیون هدف آن است که با استفاده از معادله خط رگرسیون رفتار متغیر وابسته را با آگاهی از مقادیر و مشخصات متغیرهای مستقل، پیش بینی کنیم.

مثال: با توجه به نتايج مثال قبل معادله خط رگرسيون را به صورت زير دست آورده‌ايم:
در صورتي كه فرد سيگاري روزي x=7 سيگار استعمال كند، چه مدت خواب براي او پيش بيني مي‌كنيد

y=0/8x+3.8

X=تعداد سيگار متغير مستقل وY  =ساعات خواب متغير وابسته است
حل: باقرار دادن مقدار x=7 در معادله خط رگرسيون داريم:

2/9 = 3/8 + y = -0/87