2018年7月12日 下午4:16
- 机器学习本身的核心难点我认为有两个:
- 特征的提取、产生
- 各种模型本身的运行原理
- 特征提取和模型发现的共同点
- 他们描述的都是对输入数据的数学处理过程
- 一个典型的例子就是:神经网络模型
- 其中前面的卷进和池化操作也可以就说成是特征的提取,数据还维持着原先数据的部分特征
- 后面的sofmax就是一个典型的多分类模型
- 特征提取和模型发现的不同点
- 特征提取之后,数据还维持着源数据的一些特征
- 模型处理之后,最后输出的是一个处理数据的结果
- 特征提取可以理解成是平常知识的总结,而模型处理就像是老师给你的试卷在打分。
- 很多时候,在特征提取的过程中已经将原始的数据弄的非常的混乱,我也不知道为啥能够用这些已近非常混乱的数据最为特征进行处理。 说说对机器学习的认识
- 这其中可能涉及到的计算:
- 这里有简单的四则运算就可以解决
- 有些可能涉及到矩阵和向量,涉及到多个维度
- 还有些可能涉及难的算法,类似于图论等等。
- 发明特征提取和模型的难点在哪里?
- 特征提取的算法(计算方式)的发明,难点在于你不知道怎样的特征才能起到好的回归或者分类的效果,也就是说你没有目标,这时候做事情自然就不好做了。
- 1 * (?* ?* ?….) = ?
- 中间的(?* ?* ?….) 是我们的提取方法和模型,但是我们的结果不具体,并且问号有几个不知道?他们之间的组合关系是啥也不知道?问号代表的一种运算,但具体是啥也不知道?