使用Python从Excel获取运营数据

现有的Excel分为两种格式:xls(Excel 97-2003)和xlsx(Excel 2007及以上)。

Python处理Excel文件主要是第三方模块库xlrd、xlwt、pyexcel-xls、xluntils和pyExcelerator,以及win32com和openpyxl模块,此外Pandas中也带有可以读取Excel文件的模块(read_excel)。

基于扩展知识的目的,我们使用xlrd模块读取Excel数据。 继续阅读使用Python从Excel获取运营数据

Python基础数据处理库-NumPy

最近更新:2017-07-19


 

NumPy是Python做数据处理的底层库,是高性能科学计算和数据分析的基础,比如著名的Python机器学习库SKlearn就需要NumPy的支持。掌握NumPy的基础数据处理能力是利用Python做数据运算及机器学习的基础。

  • NumPy(或简称NP)的主要功能特性如下:
  • 具有数组(ndarray)能力,这是一个具有矢量算术运算和复杂广播的快速且节省空间的多维数组。
  • 用于对整租数据进行快速运算的标准数学函数(代替循环实现)。
  • 可用于读写数据以及操作内存映射文件。
  • 具有线性代数、随机数生成以及傅里叶交换功能。
  • 可集成C、C++、Fortran等语言,提供了简单易用的C API,很容易将数据传递给低级语言编写的外部库,也能以NumPy数组的形式将数据返回给Python。

继续阅读Python基础数据处理库-NumPy