رگرسیون یک روش یادگیری ماشینی نظارت شده برای درک رابطه بین متغیرها یا ویژگی های مستقل و یک متغیر یا نتیجه وابسته است. یکی از الگوریتمهایی که برای رگرسیون استفاده میشود، “رگرسیون خطی” است.
در اینجا، ما از دیتاست house-prices.csv برای اهداف رگرسیونی استفاده می کنیم و می توانید این دیتاست را از لینک بالای این صفحه دانلود کنید. این دیتاست دارای 6 متغیر ویژگی است:
“تعداد اتاق خواب”, “تعداد سرویس بهداشتی”, “مساحت خانه (SqFt)”, “تعداد پیشنهادها”, “آجری بودن” و “منطقه همسایگی”
و متغیر پیش بینی برابر است با: “قیمت خانه”.
در فرم بالا مقادیر 6 متغیر ویژگی را وارد می کنید و مدل در یک فرم پاپ آپ قیمت خانه را برمی گرداند. از آنجایی که 2 متغیر ویژگی از دیتاست ما متنی و 4 مورد از آنها عددی است، برای استفاده از رگرسیون خطی برای این دیتاست ترکیبی، باید متغیرهای ویژگی متنی را به برچسب های عددی تبدیل کنیم و سپس می توانیم از روش رگرسیون خطی استفاده کنیم.
توجه داشته باشید که مقادیر و محدوده های هر متغیر ویژگی به شرح زیر است:
کد نمونه مورد استفاده برای آموزش مدل رگرسیون خطی در لینک بالای همین صفحه ارائه شده است. هر بار که این فرم را اجرا می کنید و پیش بینی ها اتفاق می افتد، مقادیر در پایگاه داده ذخیره می شوند و با لینک "نتایج" در بالای این صفحه، نتایج قبلی پیش بینی مدل را مشاهده خواهید کرد. اجرای اخیر شما به انتهای این لیست اضافه خواهد شد.