0%

pandas与numpy对比

2018年3月5日 下午2:55

前提:

  1. 我这篇文章的依据是第一课和第二课的中的关于PM2.5的两个项目,一个使用numpy一个使用pandas

理解pandas的过人之处:

  1. 核心理解方式有两个:
    1. 用excel去理解
    2. 用sql语句去理解
  2. pandas与numpy的本质区别:
    1. 是对数据的处理所占的角度不同,这里的excel、sql其实代表着就是各自的思考角度

详细说明:

  1. dropna站在整个表角度进行处理,不用按行进行处理了
  2. Excle式操作,方便的增加列,操作索引
  3. 向量式的操作方式,类似于sql语句的高级语法,将for循环使用groupby cut等这类操作代替


  4. 依然延续了numpy常用的中的mask操作
  5. 依然延续了numpy的向量化思维,以行、列作为处理的对象,而不是元素