神经网络(深度学习)中如何训练一条边的权重的

发表于 2018-09-28 更新于 2020-03-12 分类于 c数据科学/mac_机器学习/深度学习+视觉/总结部分阅读次数：
本文字数： 239 阅读时长 ≈ 1 分钟

2018年9月28日下午11:16
如果用数学来解释的话：相当于是对常数进行求导，那么结果必然为0

首先需要说明的是，这一趟只有一个数据。
下图中的导数反映的是：w这条边对最后结果L有多少的影响力。
1. 导数=0，说明对结果L的影响力为0。
2. 导致w这条边的值w在处理下一个数据的时候是没有被变更的。
3. 在这种情况下的坏处是：影响力为0，说明这个位置的点数据(神经元)是不重要的，但是一旦这个位置数据受到污染，那么他就会按初始化的权重值w来影响预测，并且影响还很大。
在下面这个例子中很能体现这一点。

人工神经网络的训练过程（反向传播的过程）

发表于 2018-09-28 更新于 2020-03-12 分类于 c数据科学/mac_机器学习/入门阶段/小象机器学习/knowledge 阅读次数：
本文字数： 121 阅读时长 ≈ 1 分钟

2018年9月28日下午10:01

2018年9月28日下午10:22

这个等式就是推导隐藏层反向传播的源头，导数是由这个等式求导而来
要想手推训练过程，尤其是反向传播的过程：
1. 流程是：先写出等式，在由等式去求导，最后才可以带入数据，求得最后的结果。

batch和全数据集训练的不同

发表于 2018-09-28 更新于 2020-03-12 分类于 c数据科学/mac_机器学习/深度学习+视觉/总结部分阅读次数：
本文字数： 188 阅读时长 ≈ 1 分钟

2018年9月28日下午9:33
当我们分批学习时，每次使用过全部训练数据完成一次Forword运算以及一次BP运算，成为完成了一次epoch。

batch:是用多个局部最优，最后平均出一个全局最优。
全数据集：是直接求出全局最优。
结论：如果数据集较小，可以采用全数据集（Full batch learning）的形式

深度学习中的batch、batch size与epoch - CSDN博客

频率图像的理解

发表于 2018-09-28 更新于 2020-03-12 分类于 c数据科学/mac_机器学习/深度学习+视觉/总结部分阅读次数：
本文字数： 207 阅读时长 ≈ 1 分钟

2018年9月28日下午8:46
我现在理解其实频率图像其实就是数据的另外一种编码格式而已。
就比如说在sift也是一种对于图像特征的一种编码方式

有关于图像频率域和滤波的总结 - CSDN博客

理解：

假设将原图上画一条线，这条线根据亮度高低等信息，可以描述成一个正弦波。这个正弦波，在我们转换到的频率图像上可能是一个点。也就说，有可能频率图像中某点的位置+这个点的值就对应于原图像中的一条线的整个信息。这还把图像进行了压缩。

RNN->LSTM

发表于 2018-09-28 更新于 2020-03-12 分类于 c数据科学/mac_机器学习/入门阶段/小象机器学习/knowledge 阅读次数：
本文字数： 288 阅读时长 ≈ 1 分钟

2018年9月28日下午1:51

CNN和RNN的不同：
1. CNN处理的数据是矩阵(图像)，而RNN中处理的数据是向量。所以通过RNN来处理的数据，一般要通过向量化表示的处理
CNN和RNN的相同：
1. 都是输入深度学习，对数据特征的要求不大
2. 都是通过反向传播的方法来修改参数
RNN和LSTM的区别：
1. LSTM拥有三个门的特殊的网络结构，而RNN是单一tanh的循环体
2. 在LSTM中的signal起到的作用就是：对应于每一位数据的重要性，因为signal是一个0~1的概率，这也是引入概率的一个技巧
3. LSTM有三个共享的权重矩阵，而RNN只有一个
怎样理解权重矩阵？
1. 权重矩阵其实体现的就是对数据的挑选

词袋模型

发表于 2018-09-28 更新于 2020-03-12 分类于 c数据科学/mac_机器学习/入门阶段/小象机器学习/knowledge 阅读次数：
本文字数： 535 阅读时长 ≈ 1 分钟

2018年9月28日下午1:47

文本数据预处理：sklearn 中 CountVectorizer、TfidfTransformer 和 TfidfVectorizer - CSDN博客

词袋模型假设我们不考虑文本中词与词之间的上下文关系，仅仅只考虑所有词的权重。而权重与词在文本中出现的频率有关。
总体感知：
1. 词袋模型首先会进行分词，在分词之后，通过统计每个词在文本中出现的次数，我们就可以得到该文本基于词的特征，如果将各个文本样本的这些词与对应的词频放在一起，就是我们常说的向量化。向量化完毕后一般也会使用 TF-IDF 进行特征的权重修正，再将特征进行标准化。再进行一些其他的特征工程后，就可以将数据带入机器学习模型中计算。
词频向量化
1. CountVectorizer 类会将文本中的词语转换为词频矩阵，例如矩阵中包含一个元素a[i][j]，它表示j词在i类文本下的词频。它通过 fit_transform 函数计算各个词语出现的次数，通过get_feature_names()可获取词袋中所有文本的关键字，通过 toarray()可看到词频矩阵的结果。
TF-IDF处理
1. 然而有些词在文本中尽管词频高，但是并不重要，这个时候就可以用TF-IDF技术。
2. TF-IDF模型的概率解释 - Todd Wei - 博客园

第九课总结：

发表于 2018-09-26 更新于 2020-03-12 分类于 c数据科学/mac_机器学习/入门阶段/小象机器学习/knowledge 阅读次数：
本文字数： 67 阅读时长 ≈ 1 分钟

2018年9月26日下午8:07

我觉得就是一个数据的处理，并且有很多现成的库可以直接调用，来处理数据
稍微有点深度的就是数据向量化的表示

B树和B+树的插入、删除图文详解

发表于 2018-09-18 更新于 2020-06-08 分类于 b计算机基础/h_算法/算法学习过程/研一阅读次数：
本文字数： 211 阅读时长 ≈ 1 分钟

2018年9月18日下午3:54

B树和B+树的插入、删除图文详解 - nullzx - 博客园
总结：

B+是B树的改进版：
1. 最大的区别是：B+树所有的数据都在叶子节点中体现，非叶子节点上的数据，在叶子节点也可以找到。非叶子节点上的数据仅仅是分类的标志。
2. 直观理解：B+树对数据起到的作用是分类作用，将有关的的数据“聚”在一起，并且还都聚集在叶子节点上，直观明了。
树这种数据结构的作用：
1. 一：能体现数据之间的顺序
2. 二：能体现数据之间的聚合关系

红-黑树

发表于 2018-09-18 更新于 2020-06-08 分类于 b计算机基础/h_算法/算法学习过程/研一阅读次数：
本文字数： 358 阅读时长 ≈ 1 分钟

2018年9月18日下午3:54
【数据结构和算法05】红-黑树（看完包懂~） - CSDN博客
注:这个里面没有删除
The-Art-Of-Programming-By-July/03.01.md at master · julycoding/The-Art-Of-Programming-By-July · GitHub
这个有删除
http://www.cs.princeton.edu/~rs/talks/LLRB/RedBlack.pdf

理解：

红黑树和AVL之间的区别？
1. 红黑树是相对平衡，而AVL是绝对平衡
红黑树比AVL好在哪里？
插入的关键：
1. 插入的一定是红色的，因为插入黑色一定会冲突，而红色不一定冲突
2. 要着重考虑父节点的兄弟节点，原因是：这是区分三种处理方式的关键点
删除节点：
1. 删除红色不用改变
2. 删除黑色情况十分复杂，我现在还没有弄明白

git核心总结

发表于 2018-09-11 更新于 2020-03-12 分类于 web开发/czh_java/git 阅读次数：
本文字数： 190 阅读时长 ≈ 1 分钟

2018年9月11日下午8:14

关于使用 git 合作开发时的通用操作 - 个人文章 - SegmentFault 思否
 多人开发的 Git 流程 - Android - 掘金

如何产生冲突？两种
1. 自己：merge的时候
2. 合作：pull 和 push的时候
如何解决冲突?
1. git操作总结
如何要别人的代码？
1. Pull
如何给别人自己的代码？
1. push
两个人/不同分支的代码如何融合？
1. merge
注：上面这三点也是容易产生冲突的地方