分类目录归档:Python数据分析与数据化运营

渠道测试性投放——选自《电商流量数据化运营》


4.6.1 渠道测试性投放概述

渠道测试性投放是在企业与第三方渠道或媒介在正式营销合作前的测试性活动,这种活动在大型企业中尤为常见,主要渠道集中在硬广告类等费用或资源投入较多的渠道。

本节的测试性投放,特指企业与大型营销渠道(主要是硬广告类)在正式合作之前的测试性投放活动。此外,企业通过自己控制的广告媒体(例如信息流和SEM),例如通过不同广告版本的迭代来测试投放人群、素材、文案等以实现广告效果的提升等,此类活动更多的属于落地过程中的测试及优化操作,不在本节内容范畴内。

4.6.2 测试性投放中的噪音控制

在测试性投放过程中,不可避免的会受到“噪音”影响,这些“噪音”会干扰最终结果的评估与判断

继续阅读

《Python数据分析与数据化运营》第一版 勘误


由于本书的作者水平有限并受限于有限的撰稿时间,以及整个出版环节众多可能会出现信息不对称,书中难免会出现一些错误或者不准确的地方,在此陈列出来供读者参考。这些已经发现的“错误”,会在下一次重印或再版时修正,有关修正的部分,会额外做标记,请读者朋友留意。

> 特别提示:由于第一版采用的仍然是Python2代码,因此在Python2下能正常工作,但是Python3下会出现的问题,不在此看勘误列表内。

最近更新时间:2019-04-22


> 提示:在2018年11月的第一版第三次重印中,更新了部分问题,请读者留意。辨别购买版本的问题,请读者翻到如下页面的框选处:


1.在P302“5.

继续阅读

《Python数据分析与数据化运营》第二版 勘误


本书默认已经修正了第一版遇到的所有问题,因此以下勘误仅限于第二版。有关第一版的勘误,请见“《Python数据分析与数据化运营》第一版勘误”。

> 说明:由于第二版的出版时间为2019年,我已经将最新版本的代码更新到博客中,地址为:《Python数据分析与数据化运营》第二版新老版本代码对比。安装和使用最新版本的读者可参照该链接的代码。**

最近更新时间:2021-10-14


最近一次新书重印更新为2020-11(第2版第4次)重印,读者可查看“前言”的前1页找到相关信息,如下:

1.P108 第二段文字中,英语、数据、语文成绩……中的“数据”应为“数学”。

解释:如图圆圈处文字

2

继续阅读

《Python数据分析与数据化运营》第二版 老代码与新代码对照信息


由于第二版是2019年出版,某些库或方法可能已经过时,在此汇总新版本和之前书中的老版本的差异,供大家了解。

在遇到类似于“没有找到方法”、“无法找到库”、“不存在”等类似问题时,可先在这里查看下是否存在现成解决方案。

更新时间:2021-06-12


第一章

1.1 第一章最后的“销售预测应用”部分中的代码需要更新。

原始代码为:

new_x = 84610   
pre_y = model.predict(new_x) # 老版本

print(pre_y)

新版本中,需要改为:

new_x = 84610   
pre_y = model.predict([[new_x]]) # 

继续阅读

《Python数据分析与数据化运营》第二版 常见问题


在该文章中,仅总结第二版相关的问题,有关第一版的问题,请到“《Python数据分析与数据化运营》第一版常见问题”查看。

> 说明:由于第二版的出版时间为2019年,我已经将最新版本的代码更新到博客中,地址为:《Python数据分析与数据化运营》第二版新老版本代码对比。安装和使用最新版本的读者可参照该链接的代码。

最近更新时间:2021-06-15


1. 问题:第二版的书籍配套源代码下载地址?

代码下载: 《Python数据分析与数据化运营》第二版 附件

2. 问题:第二版和第一版比有哪些变化?

本书在第一版上市后,得到来自于各行各业很多好友和读者的支持和反馈,在此致以感谢!第二版在第一

继续阅读

《Python数据分析与数据化运营》第一版 常见问题


在这边文章中,我会把读者反馈给我的常见问题总结出来,供更多读者参考。里面会涉及到各种疑问或混淆知识点,希望能给大家解惑。如果大家有什么疑问,可以直接在这里留言,我会将一些跟本书相关的知识性问题总结出来并在此回答。

最近更新时间:2021-07-05


1.问题:对于一维数据而言,reshape之后仍然是一维,为什么还要做reshape操作?

在第一章的代码示例中,有一段如下代码:

x=numpy.array(x).reshape([100,1])

为什么需要对x对reshape?即使是reshape,x仍然是1维数据啊(只有一列)?

回答:对于sklearn中的fit方法而言,对输入的x的

继续阅读

3.12.4 自然语言文本预处理


说明:本文是《Python数据分析与数据化运营》中的“3.12.4 自然语言文本预处理”。 -----------------------------下面是正文内容--------------------------

与数据库中的结构化数据相比,文本具有有限的结构,某些类型的数据源甚至没有数据结构。因此,预处理就是要对半结构化或非结构化的文本进行格式和结构的转换、分解和预处理等,以得到能够用于进一步处理的基础文本。不同环境下,文本所需的预处理工作内容有所差异,大体上分为以下几个部分:

基本处理

根据不同的文本数据来源,可能涉及到的基本文本处理包括去除无效标签、编码转换、文档切分、基本纠错、去除

继续阅读

3.12.3 图像的基本预处理


说明:本文是《Python数据分析与数据化运营》中的“2.2 使用Python获取运营数据”中的第二部分,由于本节内容较多,这里分几个文章。

2.2.2 从Excel获取运营数据

现有的Excel分为两种格式:xls(Excel 97-2003)和xlsx(Excel 2007及以上)。

Python处理Excel文件主要是第三方模块库xlrd、xlwt、pyexcel-xls、xluntils和pyExcelerator,以及win32com和openpyxl模块,此外Pandas中也带有可以读取Excel文件的模块(read_excel)。

基于扩展知识的目的,我们使用xlrd模块读取Ex

继续阅读

3.11 数据处理应该考虑哪些运营业务因素


说明:本文是《Python数据分析与数据化运营》中的“3.11 数据处理应该考虑哪些运营业务因素”。 -----------------------------下面是正文内容-------------------------- 数据处理工作不仅依赖于数据工作者的数据经验,也需要考虑实际的运营业务因素。这种兼顾两种工作逻辑的工作方式会帮助数据工作少走弯路并降低数据项目失败的可能性,还有利于提高数据工作的效率和产出效果,真正让运营理解数据、应用数据并驱动业务。 数据处理时应该考虑的运营业务因素包括固定和突发运营周期、运营需求的有效性、交付时要贴合运营落地场景、专家经验、业务需求的变动因素等。

3.

继续阅读

3.12.1 网页数据解析


说明:本文是《Python数据分析与数据化运营》中的“3.12.1 网页数据解析”。 -----------------------------下面是正文内容--------------------------

本节通过一个稍微复杂一点的示例,来演示如何抓取并解析网页数据。之所以说复杂,是因为本节中会出现几个本书中未曾提及的知识和方法,从代码数量来看也会比之前的示例稍微长一点。

本示例中,将使用requests、bs4、re、time库进行网页数据读取、解析和相关处理。

示例的目标是抓取亚马逊中国网站苹果手机和配件的价格,用于做竞争对手的标杆商品价格监控。注意:本示例仅做学习之用。

在抓取和解

继续阅读