Python数据工具箱—文件读写库

文件的读写包括常见的txt、Excel、xml、二进制文件以及其他格式的数据文本,主要用于本地数据的读写。

/函数 描述 推荐度
open(name[, mode[, buffering]]) [Python内置函数]Python默认的文件读写方法 ★★★
numpy.loadtxt、numpy.load和numpy.fromfile [第三方库]Numpy自带的读写函数,包括loadtxt、load和fromfile,用于文本、二进制文件读写 ★★★
pandas.read_* [第三方库]Pandas自带的read文件方法,例如ead_csv、read_fwf、read_table等,用于文本、Excel、二进制文件、HDF5、表格、SAS文件、SQL数据库、Stata文件等的读写 ★★★
xlrd [第三方库]用于Excel文件读取 ★★
xlwt [第三方库]用于Excel文件写入 ★★
pyexcel-xl [第三方库]用于Excel文件读写 ★★
xluntils [第三方库]用于Excel文件读写 ★★
pyExcelerator [第三方库]用于Excel文件读写
openpyxl [第三方库]用于Excel文件读写
lxml [第三方库]xml和HTML读取和解析 ★★★
xml [Python标准库]xml对象解析和格式化处理 ★★★
libxml2 [第三方库]xml对象解析和格式化处理
xpath [第三方库]xml对象解析和格式化处理 ★★
win32com [第三方库]有关Windows系统操作、Office(Word、Excel等)文件读写等的综合应用库

====================【好书推荐,我为自己代言】====================

《Python数据分析与数据化运营》上市啦!

50+数据流工作知识点
14个数据分析与挖掘主题
8个综合性运营分析案例
涵盖会员、商品、流量、内容4大主题
360°把脉运营问题并贴合数据场景落地


本书主要基于Python实现,其中主要用到的计算库是numpy、pandas和sklearn,其他相关库还包括:
  • 标准库:re、time、datetime、json、 base64、os、sys、cPickle、tarfile
  • 统计分析:Statsmodels
  • 中文处理:结巴分词
  • 文本挖掘:Gensim
  • 爬虫和解析:requests、Beautiful Soup、xml
  • 图像处理:OpenCV和PIL
  • 数据读取:xlrd、pymongo、mysql.connector
  • 数据预处理:imblearn
  • 展示美化类:Matplotlib、graphviz、prettytable、wordcloud、mpl_toolkits、pydotplus
如果你对以下内容感兴趣,那么本书将值得一看:
  • KMeans聚类的自动K均值的确立方法
  • 基于软方法的多分类模型组合评估模型的应用
  • 基于自动下探(下钻、细分)的应用
  • 基于增量学习的多项式贝叶斯分类
  • pipeline管道技术的应用
  • 基于超参数的自动参数值的优化方法
  • 特征自动选择
  • 文本分类、文本主题挖掘
  • 基于自动时间序列ARIMA的P、D、Q的调整
  • python决策树规则输出
  • 基于自定义图像的文本标签云
  • 非结构化数据,例如图像、音频、文本等处理
  • 对象持久化处理
有关这本书的写作感受、详细内容介绍、附件(含数据和代码源文件-源代码可更改数据源直接使用)下载、关键知识和方法以及完整书稿目录,请访问《Python数据分析与数据化运营》新书上线,要购买此书请直接点击图片或扫描二维码去京东购买

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>