3.12.2 网络用户日志解析

说明:本文是《Python数据分析与数据化运营》中的“3.12.2 网络用户日志解析”。

-----------------------------下面是正文内容--------------------------

网络用户日志属于非结构化数据的一种,其解析方法根据不同的服务器配合和跟踪实施需要自定义模块,本节将以一个示例来演示如何进行日志解析。 继续阅读3.12.2 网络用户日志解析

3.12.1 网页数据解析

说明:本文是《Python数据分析与数据化运营》中的“3.12.1 网页数据解析”。

-----------------------------下面是正文内容--------------------------

本节通过一个稍微复杂一点的示例,来演示如何抓取并解析网页数据。之所以说复杂,是因为本节中会出现几个本书中未曾提及的知识和方法,从代码数量来看也会比之前的示例稍微长一点。 继续阅读3.12.1 网页数据解析

3.8 有关相关性分析的混沌

说明:本文是《Python数据分析与数据化运营》中的“3.8 有关相关性分析的混沌”。

-----------------------------下面是正文内容--------------------------

相关性分析是指对多个具备相关关系的变量进行分析,从而衡量变量间的相关程度或密切程度。相关性可以应用到所有数据的分析过程中,任何事物之间都是存在一定的联系。相关性用R(相关系数)表示,R的取值范围是[-1,1]。 继续阅读3.8 有关相关性分析的混沌

3.7 解决运营数据的共线性问题

说明:本文是《Python数据分析与数据化运营》中的“3.7 解决运营数据的共线性问题”。

-----------------------------下面是正文内容--------------------------

所谓共线性(也称为多重共线性)问题指的是输入的自变量之间存在较高的线性相关度。共线性问题会导致回归模型的稳定性和准确性大大降低,另外,过多无关的维度参与计算也会浪费计算资源和时间。 继续阅读3.7 解决运营数据的共线性问题