2019年3月30日 下午11:11
续:
特征工程与竞赛
PPT:
模式识别与机器学习
- 在读了施一公的文章之后,我尝试使用批判性的思维去学习和整理知识,发现其实还是很有难度的。
- 我提出一个最原始的问题:如果我遇到了类似的数据和算法,我如何让他们达到最好的效果,我可以从哪些角度去解决这个问题?
- 从这堂课的学习中,有以下几种解决的方式:
- 特征选择
- 特征提取、转换
- 属性离散化
- 自动数据清洗(这个我还没有弄懂)
- 并且最后还提出问题:数学建模的困境?
- 来自于:Breiman, L. (2001). “Statistical Modeling: the Two Cultures”. Statistical Science 16 (3): 199–215.
- 这篇文章提出了机器学习所面临的几个本质问题?
- 这些问题都是几乎无法完全解决的,通过这样的问题我们也可以再多了解一些机器学习本质。
- 我更关注的:他是如何发现这其中的问题的?,这样认识问题的能力,比我自己总结一些小的科研tip强好几个层次。
- 总结反思过后,我总结:
- 我虽然现在掌握了通过提问题来发现问题、解决问题的思路技巧,但是这其中的不足是:我对事物的视角、品味比较低。
- 我关注的地方是具体的方法、模型,我总结tip和方法,以及我提出的一些问题,都是围绕这些具体的方法,想着如何理解他们,如何改进他们。
- 而,老师们的视角是站在领域和行业发展的角度去分析问题,提出的问题是这个领域的问题,更加宏观也更加深远。