深度学习基础之-2.2用梯度下降法求解w,b

用梯度下降法求解w,b。预设函数 Hypothesis Functionz=wx+bz = wx+bz=wx+b损失函数 Loss FunctionJ(w,b)=12(z−y)2J(w,b) = \frac{1}{2}(z-y)^2J(w,b)=21(z−y)2z是预测值，y是样本标签值。求w的梯度我们用J的值作为基准，去求w对它的影响，也就是J对w的偏导数（链式求导）：∂J(w...

SusanLovesTech

3839人浏览 · 2019-05-17 16:08:27

SusanLovesTech · 2019-05-17 16:08:27 发布

用梯度下降法求解w,b。

预设函数 Hypothesis Function
$z = w x + b$

损失函数 Loss Function
$\frac{1}{2}(z-y)^2$

z是预测值，y是样本标签值。

求w的梯度
我们用J的值作为基准，去求w对它的影响，也就是J对w的偏导数（链式求导）：

$\frac{\partial{J(w,b)}}{\partial{w}} = \frac{\partial{J}}{\partial{z}}\frac{\partial{z}}{\partial{w}}$

因为：

$\frac{\partial{J}}{\partial{z}} = \frac{\partial{}}{\partial{z}}[\frac{1}{2}(z-y)^2] = z-y$ $\frac{\partial{z}}{\partial{w}} = \frac{\partial{}}{\partial{w}}(wx+b) = x$

所以组合起来：

$\frac{\partial{J}}{\partial{w}} = \frac{\partial{J}}{\partial{z}}\frac{\partial{z}}{\partial{w}} = (z-y) \cdot x$

求b的梯度
$\frac{\partial{J}}{\partial{b}} = \frac{\partial{J}}{\partial{z}}\frac{\partial{z}}{\partial{b}}$

其中第一项前面算w的时候已经有了，而：

$\frac{\partial{z}}{\partial{b}} = \frac{\partial{(wx+b)}}{\partial{b}} = 1$

所以：

$\frac{\partial{J}}{\partial{b}} = \frac{\partial{J}}{\partial{z}}\frac{\partial{z}}{\partial{b}} = (z-y) \cdot 1 = z-y$

代码

if __name__ == '__main__':
    eta = 0.1
    X, Y = ReadData()
    w, b = 0.0, 0.0
    #w,b = np.random.random(),np.random.random()
    # count of samples
    num_example = X.shape[0]
    for i in range(num_example):
        # get x and y value for one sample
        x = X[i]
        y = Y[i]
        # get z from x,y
        z = w*x+b
        # calculate gradient of w and b
        dz = z - y
        db = dz
        dw = dz * x
        # update w,b
        w = w - eta * dw
        b = b - eta * db

    print(w,b)

$\cdot x，db = z-y$ ，这个和公式推导完全一样。之所以有个dz是想保存中间计算结果，不重复劳动。因为这个函数是每次内循环都被调用的，所以要尽量优化。

另外，大家可以看到，在代码中，我们并没有直接计算损失函数值，而只是把它融入在公式推导中。

木头：哦！我明白了，原来大名鼎鼎的梯度下降，其实就是把推导的结果转化为数学公式和代码，直接放在迭代过程里！

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

不养有毒“龙虾”！这份安全养殖教程来了！

2048 AI社区

2026年智能体平台选型指南：这七项功能决定企业效率提升的成败

2048 AI社区

3月12日打卡

代码问题：整除的尾数作者: Turbo时间限制: 1s章节: 函数问题描述一个整数，只知道前几位为a，不知道末二位，被另一个整数b除尽了(即没有余数)，那么该数的末二位该是什么呢？程序已完成主体框架,请完成以下函数getResult的函数体。getResult的功能为：根据传入的参数a和b，求出所有符合条件的末二位（尾数）放入数组weishu中，数组weishu按升序排列。函数返回符合条件的尾数个