Python数据工具箱—数据清洗转换库

数据清洗转换主用于数据正式应用之前的预处理工作。

/函数 描述 推荐度
frozenset([iterable]) [Python内置函数]返回一个新的frozenset对象,可选择从iterable取得的元素 ★★★
int(x) [Python内置函数]返回x的整数部分 ★★★
isinstance(object, classinfo) [Python内置函数]返回object是否是指定的classinfo实例信息 ★★★
len(s) [Python内置函数]返回对象的长度或项目数量 ★★★
long(x) [Python内置函数]返回由字符串或数字x构造的长整型对象 ★★★
max(iterable[, key]) [Python内置函数]返回一个可迭代或最大的两个或多个参数中的最大项 ★★★
min(iterable[, key]) [Python内置函数]返回一个可迭代或最大的两个或多个参数中的最小项 ★★★
range(start, stop[, step]) [Python内置函数]用于与for循环一起创建循环列表,通过指定start(开始)、stop(结束)和step(步长)控制迭代次数并获取循环值 ★★★
raw_input(prompt) [Python内置函数]捕获用户输入并作为字符串返回(不推荐使用input作为用户输入的捕获函数) ★★★
round(number[, ndigits]) [Python内置函数]返回number小数点后ndigits位的四舍五入的浮点数 ★★★
set([iterable]) [Python内置函数]返回一个新的集合对象,可选择从iterable获取的元素 ★★★
slice(start, stop[, step]) [Python内置函数]返回表示由范围(start、stop、step)指定的索引集的切片对象 ★★
sorted(iterable[, cmp[, key[, reverse]]]) [Python内置函数]从iterable的项中返回一个新的排序列表 ★★★
xrange(start, stop[, step]) [Python内置函数]此函数与range()非常相似,但返回一个xrange对象而不是列表 ★★★
string [Python标准库]字符串处理库,可实现字符串查找、分割、组合、替换、去重、大小写转换及其他格式化处理 ★★★
re [Python标准库]正则表达式模块,在文本和字符串处理中经常使用 ★★★
random [Python标准库]该模块为各种分布实现伪随机数生成器,支持数据均匀分布、正态(高斯)分布、对数正态分布、负指数分布、伽马和β分布等 ★★★
os [Python标准库]用于新建、删除、权限修改、切换路径等目录操作,以及调用执行系统命令 ★★★
os.path [Python标准库]针对目录的遍历、组合、分割、判断等操作,常用于数据文件的判断、查找、合并 ★★★
prettytable [Python标准库]格式化表格输出模块 ★★
json [Python标准库]Python对象与json对象的转换 ★★★
base64 [Python标准库]将任意二进制字符串编码和解码为文本字符串的Base16,Base32和Base64 ★★★

====================【好书推荐,我为自己代言】====================

《电商流量数据化运营》出版了!

  • 10余年业务经验总结:将我在甲方和乙方,跨企业和跨行业的经验总结起来,供大家快速提升,少走弯路。
  • 流量运营教科书:内容围绕流量数据化运营的全流程展开,涵盖渠道策略与计划管理、媒体投放与执行管理、渠道投放效果评估与分析、流量运营监控与效果复盘等各个环节。
  • 有用、实用:不讲数据分析理论,不讲数据分析工具使用,所有方法均可在工作中直接使用,而且围绕流量数据化运营的常见问题展开。
  • 易用、易读:不要求会Python,会用Excel就行,无晦涩难懂的理论和复杂的推导过程。
  • 以场景应用为核心:以业务场景为切入点,内容上围绕业务问题、数据支持方案、实用工具实操的思路,用数据解决每个具体业务问题。
如果你对本书感兴趣,请点击这里查看更多信息!当然,你也可以先加我微信了解一下。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注