机器学习本身的核心难点

2018年7月12日下午4:16

机器学习本身的核心难点我认为有两个：
1. 特征的提取、产生
2. 各种模型本身的运行原理
特征提取和模型发现的共同点
1. 他们描述的都是对输入数据的数学处理过程
2. 一个典型的例子就是：神经网络模型
  1. 其中前面的卷进和池化操作也可以就说成是特征的提取，数据还维持着原先数据的部分特征
  2. 后面的sofmax就是一个典型的多分类模型
特征提取和模型发现的不同点
1. 特征提取之后，数据还维持着源数据的一些特征
2. 模型处理之后，最后输出的是一个处理数据的结果
3. 特征提取可以理解成是平常知识的总结，而模型处理就像是老师给你的试卷在打分。
4. 很多时候，在特征提取的过程中已经将原始的数据弄的非常的混乱，我也不知道为啥能够用这些已近非常混乱的数据最为特征进行处理。说说对机器学习的认识
这其中可能涉及到的计算：
1. 这里有简单的四则运算就可以解决
2. 有些可能涉及到矩阵和向量，涉及到多个维度
3. 还有些可能涉及难的算法，类似于图论等等。
发明特征提取和模型的难点在哪里？
1. 特征提取的算法(计算方式)的发明，难点在于你不知道怎样的特征才能起到好的回归或者分类的效果，也就是说你没有目标，这时候做事情自然就不好做了。
2. 1 * (？* ？* ？….) = ？
  1. 中间的(？* ？* ？….) 是我们的提取方法和模型，但是我们的结果不具体，并且问号有几个不知道？他们之间的组合关系是啥也不知道？问号代表的一种运算，但具体是啥也不知道？