Linear Regression using Gradient Descent

$ \mathbf{x}_i $ is a $ D $-dimensional feature vector
$ y_i $ is a real-valued target
Each feature $ x_i^{(j)} \in \mathbb{R} $, where $ j = 1, …, D $
The model is: $$ f_{\mathbf{w}, b}(\mathbf{x}) = \mathbf{w} \cdot \mathbf{x} + b $$
$ \mathbf{w} $: weights, $ b $: bias

Goal: Predict Sales based on Spending.

Model: $ f(x) = wx + b $

Objective: Minimize MSE:

$$
l = \frac{1}{N} \sum_{i=1}^{N} (y_i – (wx_i + b))^2
$$

Gradients:

\[ \frac{\partial l}{\partial w} = \frac{1}{N} \sum_{i=1}^{N} -2x_i(y_i – (wx_i + b)) \]

\[ \frac{\partial l}{\partial b} = \frac{1}{N} \sum_{i=1}^{N} -2(y_i – (wx_i + b)) \]

Update equations:

\[
w \leftarrow w + \frac{2\alpha}{N} \sum_{i=1}^{N} x_i(y_i – (wx_i + b))
\]

\[
b \leftarrow b + \frac{2\alpha}{N} \sum_{i=1}^{N} (y_i – (wx_i + b))
\]

Import Libraries: numpy, matplotlib.pyplot, matplotlib.animation
Define Dataset: 15 (x, y) pairs
Initialize Parameters: $ w = 0.0, b = 0.0, \alpha = 0.0005, \text{epochs} = 100 $
Training Loop:
- Predict $ \hat{y} = wx + b $
- Compute Loss: $$ \text{MSE} = \frac{1}{N} \sum (y – \hat{y})^2 $$
- Compute Gradients:
- $ \frac{\partial L}{\partial w} = \frac{2}{N} \sum x(y – \hat{y}) $
- $ \frac{\partial L}{\partial b} = \frac{2}{N} \sum (y – \hat{y}) $
- Update $ w, b $
Set Up Plots: Left: scatter + line, Right: loss curve
Define Animation: Update line and loss with frame
Run Animation: FuncAnimation()

🙏 Thank You!