0%

2018年9月28日 下午11:16
如果用数学来解释的话:相当于是对常数进行求导,那么结果必然为0

  1. 首先需要说明的是,这一趟只有一个数据。
  2. 下图中的导数反映的是:w这条边对最后结果L有多少的影响力
    1. 导数=0,说明对结果L的影响力为0。
    2. 导致w这条边的值w在处理下一个数据的时候是没有被变更的
    3. 在这种情况下的坏处是:影响力为0,说明这个位置的点数据(神经元)是不重要的,但是一旦这个位置数据受到污染,那么他就会按初始化的权重值w来影响预测,并且影响还很大。
  3. 在下面这个例子中很能体现这一点。

2018年9月28日 下午10:01


2018年9月28日 下午10:22

  1. 这个等式就是推导隐藏层反向传播的源头,导数是由这个等式求导而来
  2. 要想手推训练过程,尤其是反向传播的过程:
    1. 流程是:先写出等式,在由等式去求导,最后才可以带入数据,求得最后的结果。

















2018年9月28日 下午9:33
当我们分批学习时,每次使用过全部训练数据完成一次Forword运算以及一次BP运算,成为完成了一次epoch

batch:是用多个局部最优,最后平均出一个全局最优。
全数据集:是直接求出全局最优。
结论:如果数据集较小,可以采用全数据集(Full batch learning)的形式

深度学习中的batch、batch size与epoch - CSDN博客

2018年9月28日 下午8:46
我现在理解其实频率图像其实就是数据的另外一种编码格式而已。
就比如说在sift也是一种对于图像特征的一种编码方式

有关于图像频率域和滤波的总结 - CSDN博客

理解:

  1. 假设将原图上画一条线,这条线根据亮度高低等信息,可以描述成一个正弦波。这个正弦波,在我们转换到的频率图像上可能是一个点。也就说,有可能频率图像中某点的位置+这个点的值就对应于原图像中的一条线的整个信息。这还把图像进行了压缩。

2018年9月28日 下午1:51

  1. CNN和RNN的不同:
    1. CNN处理的数据是矩阵(图像),而RNN中处理的数据是向量。所以通过RNN来处理的数据,一般要通过向量化表示的处理
  2. CNN和RNN的相同:
    1. 都是输入深度学习,对数据特征的要求不大
    2. 都是通过反向传播的方法来修改参数
  3. RNN和LSTM的区别:
    1. LSTM拥有三个门的特殊的网络结构,而RNN是单一tanh的循环体
    2. 在LSTM中的signal起到的作用就是:对应于每一位数据的重要性,因为signal是一个0~1的概率,这也是引入概率的一个技巧
    3. LSTM有三个共享的权重矩阵,而RNN只有一个
  4. 怎样理解权重矩阵?
    1. 权重矩阵其实体现的就是对数据的挑选

2018年9月28日 下午1:47

文本数据预处理:sklearn 中 CountVectorizer、TfidfTransformer 和 TfidfVectorizer - CSDN博客

  1. 词袋模型假设我们不考虑文本中词与词之间的上下文关系,仅仅只考虑所有词的权重。而权重与词在文本中出现的频率有关
  2. 总体感知:
    1. 词袋模型首先会进行分词,在分词之后,通过统计每个词在文本中出现的次数,我们就可以得到该文本基于词的特征,如果将各个文本样本的这些词与对应的词频放在一起,就是我们常说的向量化。向量化完毕后一般也会使用 TF-IDF 进行特征的权重修正,再将特征进行标准化。 再进行一些其他的特征工程后,就可以将数据带入机器学习模型中计算。
  3. 词频向量化
    1. CountVectorizer 类会将文本中的词语转换为词频矩阵,例如矩阵中包含一个元素a[i][j],它表示j词在i类文本下的词频。它通过 fit_transform 函数计算各个词语出现的次数,通过get_feature_names()可获取词袋中所有文本的关键字,通过 toarray()可看到词频矩阵的结果。
  4. TF-IDF处理
    1. 然而有些词在文本中尽管词频高,但是并不重要,这个时候就可以用TF-IDF技术。
    2. TF-IDF模型的概率解释 - Todd Wei - 博客园

2018年9月18日 下午3:54

B树和B+树的插入、删除图文详解 - nullzx - 博客园
总结:

  1. B+是B树的改进版:
    1. 最大的区别是:B+树所有的数据都在叶子节点中体现,非叶子节点上的数据,在叶子节点也可以找到。非叶子节点上的数据仅仅是分类的标志。
    2. 直观理解:B+树对数据起到的作用是分类作用,将有关的的数据“聚”在一起,并且还都聚集在叶子节点上,直观明了。
  2. 树这种数据结构的作用:
    1. 一:能体现数据之间的顺序
    2. 二:能体现数据之间的聚合关系

2018年9月18日 下午3:54
【数据结构和算法05】 红-黑树(看完包懂~) - CSDN博客
注:这个里面没有删除
The-Art-Of-Programming-By-July/03.01.md at master · julycoding/The-Art-Of-Programming-By-July · GitHub
这个有删除
http://www.cs.princeton.edu/~rs/talks/LLRB/RedBlack.pdf

理解:

  1. 红黑树和AVL之间的区别?
    1. 红黑树是相对平衡,而AVL是绝对平衡
  2. 红黑树比AVL好在哪里?
  3. 插入的关键:
    1. 插入的一定是红色的,因为插入黑色一定会冲突,而红色不一定冲突
    2. 要着重考虑父节点的兄弟节点,原因是:这是区分三种处理方式的关键点
  4. 删除节点:
    1. 删除红色不用改变
    2. 删除黑色情况十分复杂,我现在还没有弄明白

2018年9月11日 下午8:14

关于使用 git 合作开发时的通用操作 - 个人文章 - SegmentFault 思否
多人开发的 Git 流程 - Android - 掘金

  1. 如何产生冲突?两种
    1. 自己:merge的时候
    2. 合作:pull 和 push的时候
  2. 如何解决冲突?
    1. git操作总结
  3. 如何要别人的代码?
    1. Pull
  4. 如何给别人自己的代码?
    1. push
  5. 两个人/不同分支的代码如何融合?
    1. merge
  6. 注:上面这三点也是容易产生冲突的地方