0%

受限玻尔兹曼机(RBM)

发表于 2019-04-28 更新于 2020-03-12 分类于 c数据科学/czh_机器学习/knowledge 阅读次数：
本文字数： 716 阅读时长 ≈ 1 分钟

2019年4月28日下午2:12

我有一个问题理解不了？

1. 为什么Hiton要使用统计力学里的”玻尔兹曼分布”的概念，这个出发点我目前还理解不了。
    1. **这个理解不了说明自己还没有理解透这个模型**

模型的理解:

受限玻尔兹曼机 - 维基百科，自由的百科全书
 深度学习方法：受限玻尔兹曼机RBM（一）基本概念 - Bin 的专栏 - CSDN博客
 深度学习方法：受限玻尔兹曼机RBM（二）网络模型 - Bin 的专栏 - CSDN博客

核心出发点：

是借用了统计力学里的”玻尔兹曼分布”的概念 (一个微粒在某个状态的几率和那个状态的能量的指数成反比, 和它的温度的倒数之指数成反比), 使用所谓的”限制玻尔兹曼机” (RBM)来学习.
RBM是一个能量模型（Energy based model, EBM），是从物理学能量模型中演变而来；
1. 能量模型需要做的事情就是先定义一个合适的能量函数，
2. 然后基于这个能量函数得到变量的概率分布，
3. 最后基于概率分布去求解一个目标函数（如最大似然）

与深度网络进行分类的区别：

目的不同：
1. RBM目的：求出一个合适的W权重，并没有一个明确的输出的概念
loss function （cost function）的指代的概念不同：
1. RBM：指的是最大似然函数
2. 深度网络：与标准答案之间的距离

模型的求解：

我没看具体的求解 ：

算法难点主要就是对W求导（当然还有bias参数），用于梯度下降的更新；
但是因为V和H都是二值化的，没有连续的可导函数去计算，
1. 实际中采用的sampling的方法来计算，这里面就可以用比如gibbs sampling的方法，
2. 当然，Hinton提出了对比散度CD方法，比gibbs方法更快，已经成为求解RBM的标准解法。
  【归档】深度学习方法：受限玻尔兹曼(三)(四)