سلام دوستان! امروز میخوایم درباره یه مبحث خیلی مهم و پرکاربرد در آمار و یادگیری ماشین صحبت کنیم: رگرسیون خطی. شاید اسمش یکم ترسناک به نظر برسه، ولی خیالتون راحت باشه، خیلی سادهتر از چیزیه که فکر میکنید.
فرض کنید میخواید یه چیزی رو پیشبینی کنید، مثلاً قیمت یه خونه رو. عوامل زیادی روی قیمت خونه تاثیر دارن، مثل متراژ، تعداد اتاقها، موقعیت مکانی و... رگرسیون خطی به ما کمک میکنه تا یه رابطهای بین این عوامل (که بهشون میگیم متغیرهای مستقل) و قیممت خونه (که بهش میگیم متغیر وابسته) پیدا کنیم.
به زبان سادهتر، رگرسیون خطی سعی میکنه یه خط (یا یه صفحه، اگه متغیرهای مستقل بیشتری داشته باشیم) پیدا کنه که بهترین تطابق رو با دادههای ما داشته باشه. این خط به ما کمک میکنه تا بر اساس متغیرهای مستقل، مقدار متغیر وابسته رو پیشبینی کنیم.
رگرسیون خطی به چند دلیل خیلی مهمه:
فرض کنید یه مغازه بستنیفروشی داریم. میخوایم ببینیم که بین دمای هوا و میزان فروش بستنی چه رابطهای وجود داره. دادههای زیر رو جمعآوری کردیم:
دمای هوا (درجه سانتیگراد) | میزان فروش بستنی (تومان) |
---|---|
20 | 100000 |
25 | 150000 |
30 | 200000 |
35 | 250000 |
با استفاده از رگرسیون خطی، میتونیم یه خط پیدا کنیم که بهترین تطابق رو با این دادهها داشته باشه. این خط نشون میده که هر چقدر دمای هوا بالاتر بره، میزان فروش بستنی هم بیشتر میشه.
فرمول رگرسیون خطی به این شکله:
Y = a + bX
توی این فرمول:
Y
متغیر وابسته (مثلاً میزان فروش بستنی) هست.X
متغیر مستقل (مثلاً دمای هوا) هست.a
عرض از مبدا (مقدار Y وقتی X برابر صفر باشه) هست.b
شیب خط (نشون میده که به ازای هر واحد افزایش در X، Y چقدر تغییر میکنه) هست.برای پیادهسازی رگرسیون خطی، میتونیم از ابزارها و کتابخونههای مختلفی استفاده کنیم، مثل:
یه مثال ساده پایتون:
from sklearn.linear_model import LinearRegression
import numpy as np
# داده ها
X = np.array([20, 25, 30, 35]).reshape((-1, 1))
y = np.array([100000, 150000, 200000, 250000])
# ساخت مدل رگرسیون خطی
model = LinearRegression()
# آموزش مدل
model.fit(X, y)
# پیش بینی
temperature = 40
predicted_sales = model.predict([[temperature]])
print(f"پیش بینی فروش بستنی در دمای {temperature} درجه: {predicted_sales[0]} تومان")
رگرسیون خطی با وجود سادگی و کاربردی بودنش، یه سری محدودیتها هم داره:
رگرسیون خطی یه ابزار ساده و قدرتمنده که به ما کمک میکنه تا رابطهای بین متغیرها پیدا کنیم و مقادیر رو پیشبینی کنیم. با وجود محدودیتهاش، به دلیل سادگی و تفسیرپذیریش، یه گزینه عالی برای شروع تحلیل دادههاست. امیدوارم این توضیحات براتون مفید بوده باشه و با این مفهوم آشنا شده باشین.
یادگیری ماشین، دنیای بسیار پرباری است و رگرسیون خطی تنها یکی از در های ورودی آن است. با تمرین و کسب تجربه می توانید مهارت های خوتان را ارتقا دهید.
رگرسیون خطی، آمار، یادگیری ماشین، پیشبینی، تحلیل داده، متغیر وابسته، متغیر مستقل
امتیاز شما به این مطلب
امتیاز: 5 از 5 (مجموع 1 رای)
اولین نفری باشید که در مورد این مقاله نظر می دهید!
techfeed.ir© 2024 All rights reserved