说明:本文是《Python数据分析与数据化运营》中的“3.7 解决运营数据的共线性问题”。 -----------------------------下面是正文内容-------------------------- 所谓共线性(也称为多重共线性)问题指的是输入的自变量之间存在较高的线性相关度。共线性问题会导致回归模型的稳定性和准确性大大降低,另外,过多无关的维度参与计算也会浪费计算资源和时间。
共线性问题是否常见取决于具体业务场景,常见的具有明显的共线性的维度或变量包括:
- 访问量和页面浏览量
- 页面浏览量和访问时间
- 订单量和销售额
- 订单量和转化率
- 促销费用和销售额
- 网络展示广告费用和访客数