《Python数据分析与数据化运营》第二版出版了!

由于内容较长,我增加了索引,大家可以有针对性浏览:

一、为什么会再版?

自从2017年年底《Python数据分析与数据化运营》出版到现在大概有1年半的时间了。说来也巧,在2017年之前,Python2和Python3其实是并行前进了,官方以及第三方流行库都是强力支持两个版本的发展。但就在第一版出版不久,Python官方以及重要的第三方库陆续发布声明,将要立即或逐渐退出Python2相关版本的开发!这让我timg (1)

但是,第一版的书销售很不错,而且口碑极好。在此感谢大家的支持。好的内容要有好的读者支持,内容才能传承下去。

推广素材

二、这本书值的买吗?

这是我的第三本书了。坦白讲,前3本书都很厚,也都很贵!《Python数据分析与数据化运营》第二版更贵,定价比原来提升了30%。但坦白讲,大家买东西(包括买书)都是买性价比,而不是绝对价格。所以关于价值本身是与回报相关的,而这本书物有所值!

关于这本书的定位,我觉得有必要跟大家澄清下,以方便读者定位自己,并明确从这本书能获得什么回报。

这本书适合的人群:

对数据分析和数据化运营已经有一定的经验(工作1-3年),对统计分析有基本的理解,也用到所谓的模型和算法。但需求是要增加数据应用场景和模型的理解,建立完整体系的数据分析思维和体系,或者基于Python能实现日常数据化运营的支持(直白点说,就是学经验,而不是学工具本身)。所以,这不是一门“入门级别”的书,里面没有或很少有关于过多统计分析、算法和模型细节、原理的介绍。

对互联网新人或刚入行的同学来讲,时间(年轻)就是你们最大的优势。如何以最短的时间提升自己?学习和实践是不二法则。实践靠自己、靠平台,而学习一般成体系的都是从书本获得。当前市场的书,知识理论性完整(当然也有不完整的)的很多,缺少的是知识性、案例性、总结性的书籍。这是机会,也有价值,更是洼地。谁能以最快的速度学习更多的经验,谁就能在竞争中利于不败之地。

在职场竞争中,有些人靠工具取胜,工具玩的很溜是一个优势,但很难想象,你会一辈子靠工具吃饭,在中国是不可能的,慢慢的你们会到中层、高层,靠的不是工具、代码和操作,而是经验、管理、思维。所以,我相信,我的书会帮到你。

三、这本书与第一版相比有哪些不同之处?

关于这本书本身的内容重新、优化和增加的信息如下:

1. 优化以及重写的内容

  • 全部代码基于Python3做优化或重写,书中的Python版本是3.7。
  • 基于Jupyter做调试、分析和应用,更适合数据分析师的应用场景,包括探索性分析、数据预处理、结果可视化展示、交互式演示等。
  • 网页数据解析中基于Class做功能封装和处理,更方便以网页对象为主体的数据工作。
  • PIL/Pollow的替换和方法应用介绍,应用于图像处理工作
  • 第四章数据挖掘的案例部分,每一部分的案例都经过重写,并增加了很多知识点,并以实际案例为需求,实际应用数据挖掘算法做建模和分析应用。
  • Matplotlib调用3D图形展示多个维度的信息,并可通过拖拽展示不同角度下数据的分布情况。
  • 第五章第一个案例RFM代码的重构,以及针对不同分组的精细化运营策略的制定。
  • 第五章第二个案例基于嵌套Pipeline和FeatureUnion复合数据工作流的营销响应预测,基于复合(两层管道)的pipeline做数据工作流管理。
  • 第六章第二个案例基于基于集成算法GBDT和RandomForest的投票组合模型的异常检测,将基础算法改为GBDT和RF,这两个是典型的代表模型“准确度”和“稳定度”的代表算法,这种兼顾“准”和“稳”的模型搭配更符合实际需求。
  • 第七章基于自动节点树的数据异常原因下探分析的树形图的内容和可视化,优化了代码和样式,可视化效果更好并能获得更多信息,包括维度分解过程、主因子、其他因子和潜在因子等。

2. 新增的内容

  • 基于Anaconda的Python环境的安装和配置,更方便初学者快速搭建Python应用环境。
  • Jupyter基础工具的用法,包括安装、启动、基础操作、魔术命令、新内核安装和使用、执行shell命令、扩展和插件使用、系统基础配置等。
  • 基于Pandas的get_dummies做标志转换,即OneHotEncode转换。
  • 特征选择的降维中新增feature_selection配合SelectPercentile、VarianceThreshold、RFE、SelectFromModel做特征选择。
  • 特征转换的降维中新增PCA、LDA、FA、ICA数据转换和降维的具体方法。
  • 特征组合的降维中新增基于GBDT、PolynomialFeatures、gplearn的genetic方法做组合特征。
  • 第四章分类算法中新增使用XGboost做分类应用,以及配合graphviz输出矢量图形。
  • pyecharts的数据可视化的应用和操作,尤其是关联关系图的应用。
  • python通过rpy2调用R程序,实现关联算法的挖掘,包括直接执行程序文件、代码段、变量使用等。
  • python通过rpy2调用airma实现自动ARIMA的应用,降低Python在时间序列算法应用时的门槛。
  • 自动化学习:增加了对于自动化数据挖掘与机器学习的理论、流程、知识和应用库介绍,并基于TPOT做自动化回归和分类学习案例演示。

四、这本书都讲了什么?

  • 10大类数据预处理经验
  • 14个数据分析与挖掘主题
  • 50余个数据工作流知识点
  • 4大核心数据化运营主题
  • 8个经典综合性案例
  • 数据化运营结合数据使用场景360°落地

 

第1章 Python和数据化运营

本章将首先介绍Python与数据化运营的基本内容,然后围绕数据化运营分析所需的Python相关工具进行介绍,最后通过一个入门级别的案例,介绍如何将Python用于数据化运营。

第2章 数据化运营的数据来源

本章将从数据类型和数据来源两个方面介绍数据化运营的数据来源,在第3部分我们还会简单介绍有关读取非结构化数据集的知识,包括网页抓取数据、文本、图像、视频、语音等,用来进行数据化的整体数据资源的整合。

第3章 10条数据化运营不得不知道的数据预处理经验

数据预处理是数据化运营过程中的重要环节,它直接决定了后期所有数据工作的质量和价值输出。从数据预处理的主要内容看,包括数据清洗、转换、归约、聚合、抽样等。本章将摒弃理论和方法说教,直接介绍预处理本身可能遇到的问题及应对方法。

第4章 跳过运营数据分析和挖掘的“大坑”

本章内容涵盖聚类、回归、分类、关联、异常检测、时间序列、路径分析、漏斗分析、归因分析、热力图分析及其他统计分析相关话题;有关聚类、回归、分类、关联、异常检测和时间序列的部分,本章通过Python程序辅助功能实现。

第5章 会员数据化运营

从本章开始,我们将介绍数据化运营的具体应用,包括会员数据化运营、商品数据化运营、流量数据化运营、内容数据化运营。本章将从会员数据化运营的概述、关键指标、应用场景、数据分析模型、分析小技巧、分析大实话以及实际案例几个方面展开,逐步介绍有关会员数据化运营的方方面面。

第6章 商品数据化运营

商品运营是销售型公司的核心工作之一。本章将围绕商品数据化运营展开,内容包括概述、关键指标、应用场景、分析模型、分析小技巧、分析“大实话”及应用案例。

第7章 流量数据化运营

流量(Teaffic)是企业获得用户的第一步,对于大多数需要“自力更生”的企业而言,流量是企业运营的命脉之一,没有流量就没有一切。本章将围绕流量运营的相关话题,从流量采集处理工具、流量数据与企业数据的整合、流量运营指标、流量数据化运营分析模型、流量分析小技巧和“大实话”等方面展开,最后通过两个案例介绍如何做流量建模分析。

第8章 内容数据化运营

内容运营是信息化媒体运营的核心,对于此类公司而言,内容即公司的核心价值。本章将围绕内容运营的相关话题展开,包括分析指标、应用场景、分析模型、分析小技巧、分析大实话。最后通过两个案例介绍如何通过Python做内容数据化支持。

五、有哪些圈内大佬支持本书

本书的推荐大佬很多,包括数据化管理的先锋人物黄成明、互联网教父和布道者宋星、数据分析圈子前辈田雪峰、互联网大拿宫鑫、互联网大佬王晓东、数据分析领域前辈郑来轶、天善智能梁勇、中国统计网联合创始人赵良、数盟社区创始人兴宝、重庆大数据应用联盟创始人高峡、数据领域口碑领袖王子枫、网站分析和数据分析大佬胡力、飞鹤集团电商事业部VP凌晨、艺龙网技术部平台总监李俊、百度数据运营经理和数据挖掘大佬柳晨龙等。

以下是几位大佬的简短推荐:

数据分析师精通一两个工具是非常必要的,而Python是数据分析工具中的重器。这是一本将Python与数据分析、数据营运结合得很好的一本书,一些常用的分析方法在书中都有具体讲解。书中大量的案列也能丰富读者的使用场景,如果认真实操,一定会显著提高自己的数据分析和运营能力。

——黄成明(@数据化管理) 数据化管理咨询顾问和培训师

本书深入浅出地解析了数据分析和数据化运营的方方面面,每个知识点都是作者宝贵经验的总结。市场上不缺工具书,但是纯粹并具有深度的经验总结却少之又少,因为这需要足够的行业和职业积累。从这点上来讲,本书是经验的传递而非简单的“知识堆砌”,因此更加可贵。

——宋星 “网站分析在中国”创始人/阳狮锐奇数据解决方案总经理

本书不仅从技术角度介绍了数据采集、清洗、分析的相关工具与方法论,而且对其在运营方面的业务应用也进行了体系化的介绍,并辅以典型案例说明,是一本拿来即可用的书籍。

——田学峰猪八戒金融副总经理

近年来,不论是零售、银行、保险还是证券,各行业对数据分析技术的需求越来越强烈,Python作为大家熟知的数据挖分析工具,被广泛应用。对任何数据从业者来说,本书绝对是个惊喜,结构完整,案例丰富,假以时日,必成经典。

——宫鑫  射手学院创始人

数据化运营方面的书籍越来越多,但令人唏嘘的是理论多过实践,故事多过案例。本书有很多的实际操作讲解和案例分析,强调动手,而不仅仅是强调认知,难能可贵。推荐阅读,更建议跟随书中的内容亲自动手。

——王晓东    TrueMetrics创始人

六、本书作者是谁?

宋天龙(TonySong)

资深大数据技术专家,触脉咨询合伙人兼副总裁,前Webtrekk中国区技术和咨询负责人(德国最大在线数据分析服务提供商)。

擅长数据挖掘、建模、分析与运营,精通端到端数据价值场景设计、业务需求转换、数据结构梳理、数据建模与学习以及数据工程交付。在电子商务、零售、银行、保险等多个行业拥有丰富的数据项目工作经验;参与过集团和企业级数据体系规划、DMP与数据仓库建设、大数据产品开发、网站流量系统建设、个性化智能推荐与精准营销、企业大数据智能等项目。参与实施的客户案例包括联合利华、Webpower、德国OTTO集团电子商务(中国)、Esprit中国、猪八戒网、顺丰优选、乐视商城、泰康人寿、酒仙网、国美在线、迪信通等。

著有多部畅销书:

  • 《Python数据分析与数据化运营》
  • 《网站数据挖掘与分析:系统方法与商业实践》
  • 《企业大数据系统构建实战:技术、架构、实施与应用》

有交流的朋友可以加我微信,同时也有本书的读者群。

微信图片_20190620100020

七、促销和优惠活动

正值618之际(虽然已经尾声了),目前京东和当当都有活动,尤其是当当仍然有满100-50的活动,另外,机械工业出版社还额外提供了5元优惠券可供使用。最低价可以69到手!

暂时可用5元优惠券(由于数量有限大家抓紧使用):

  • VG8R5F
  • 3GUEJS
  • 76KPA5
  • EFNCWC

另外,出版社为了答谢第一批购买本书(第二版)的读者,另有赠书活动:

QQ截图20190620100133

所以,想要赠书的同学,尽快加出版社群的管理员,账号是:minami41,备注本书名《Python数据分析与数据化运营》第二版,然后管理员会拉入群。在满足上述条件后,@管理员,留下联系方式,会有赠书,大家抓紧!

aa

其他购买信息,可以去京东当当天猫等查看。

第二版封面2

 

八、本书的相关资源(代码和源数据)

《Python数据分析与数据化运营》第一版相关资源

《Python数据分析与数据化运营》第二版相关资源

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>