第二版老代码与新代码对照信息

由于第二版是2019年出版,某些库或方法可能已经过时,在此汇总新版本和之前书中的老版本的差异,供大家了解。

在遇到类似于“**没有找到**方法”、“无法找到**库”、“**不存在”等类似问题时,可先在这里查看下是否存在现成解决方案。

更新时间:2021-06-12

继续阅读第二版老代码与新代码对照信息

《Python数据处理、分析、可视化与数据化运营》勘误

本篇仅包括由人民邮电出版社出版的《Python数据处理、分析、可视化与数据化运营》的勘误信息,供读者参考使用。

最近更新时间:2021-01-27

继续阅读《Python数据处理、分析、可视化与数据化运营》勘误

《Python数据处理、分析、可视化与数据化运营》常见问题

本篇仅包括由人民邮电出版社出版的《Python数据处理、分析、可视化与数据化运营》的常见问题,供读者参考使用。

最近更新时间:2021-01-27

继续阅读《Python数据处理、分析、可视化与数据化运营》常见问题

《Python数据分析与数据化运营》第二版勘误

本书默认已经修正了第一版遇到的所有问题,因此以下勘误仅限于第二版。有关第一版的勘误,请见“《Python数据分析与数据化运营》第一版勘误”。

说明:由于第二版的出版时间为2019年,我已经将最新版本的代码更新到博客中,地址为:《Python数据分析与数据化运营》第二版新老版本代码对比。安装和使用最新版本的读者可参照该链接的代码。

最近更新时间:2021-05-06

最近一次新书重印更新为2020-11(第2版第4次)重印,读者可查看“前言”的前1页找到相关信息,如下:

继续阅读《Python数据分析与数据化运营》第二版勘误

《Python数据分析与数据化运营》第二版 常见问题

在该文章中,仅总结第二版相关的问题,有关第一版的问题,请到“《Python数据分析与数据化运营》第一版常见问题”查看。

说明:由于第二版的出版时间为2019年,我已经将最新版本的代码更新到博客中,地址为:《Python数据分析与数据化运营》第二版新老版本代码对比。安装和使用最新版本的读者可参照该链接的代码。

最近更新时间:2021-06-15

继续阅读《Python数据分析与数据化运营》第二版 常见问题

3.12.4 自然语言文本预处理

说明:本文是《Python数据分析与数据化运营》中的“3.12.4 自然语言文本预处理”。

-----------------------------下面是正文内容--------------------------

与数据库中的结构化数据相比,文本具有有限的结构,某些类型的数据源甚至没有数据结构。因此,预处理就是要对半结构化或非结构化的文本进行格式和结构的转换、分解和预处理等,以得到能够用于进一步处理的基础文本。不同环境下,文本所需的预处理工作内容有所差异,大体上分为以下几个部分: 继续阅读3.12.4 自然语言文本预处理