2019年6月24日 下午5:43
Cs231n Assignment1—SVM & Softmax (附带公式梯度推导) - 知乎
cs231n 课程作业 Assignment 1 - 张小彬的专栏 - CSDN博客
- 支持向量机和后面的 Softmax 分类器都是线性模型,这里只是损失函数不同罢了
- 我目前理解了SVM的,softmax我就先放放,以后有时间再看
- 笔记我写在笔记本上了
- 前向传播和计算 loss 的逻辑和 Softmax 分类器差不多,难点在于梯度的计算。因为要涉及矩阵对矩阵的梯度计算。
总结:
- 【主干】整个作业中,有两大重点:loss、dw计算+训练过程
- 其中loss、dw计算是最难的地方
- 训练过程体现的是利用loss、dw计算结果来迭代的过程
- 求导:
- 由于时间原因,我这里就不计算softmax和矩阵对矩阵的梯度计算
- 这里就是直接对公式表达进行求导,并不像VIO一样要通过左右扰动来近似求导
- 以后要自己要学的话,再新查矩阵对矩阵的梯度计算的资料吧
- 由于时间原因,我这里就不计算softmax和矩阵对矩阵的梯度计算