电商流量数据化运营
《电商流量数据化运营》第一版勘误
宋天龙
发布于 2022-01-25
5560 次阅读
0 次赞
0 次分享
AI 智能核心导读
“针对书籍第4章(P111)Excel数据源标题不一致导致新版 sklearn 中 ColumnTransformer 报错的问题,现已发布勘误。解决方案为更新数据源,确保训练集与预测集的特征名称完全统一,以保障模型预测代码正常运行。”
勘误与更新说明
最近更新时间:2021-11-09
第 4 章:Excel 数据源标题错误(P111)
问题描述
在第 4 章 4-1 中,原始 Excel 数据源里,预测数据集的标题与原始训练集的标题不一致。这会导致在预测过程中,由于输入特征名称不一致,从而引发 ColumnTransformer 过程报错。
问题原因
这种名称不一致的情况,在我写书时的环境中执行并没有问题,但在目前的 sklearn 版本中会触发报错。
解决方案
因此,我更新了数据源,以保持 Excel 中训练集和预测集的特征名称完全一致。主要修改如下图所示:

图中左侧是 Excel 修改后的名称,右侧是对应到 P111 打印输出结果中列名的变化,请读者注意区分。
💡 提示:如果上图看不清楚,可以鼠标右键选择“在新标签中打开图片”,或者使用浏览器自带的放大功能查看。
如果你对本书感兴趣,请点击 这里 查看更多信息!当然,你也可以先加我微信了解一下。
分享
最后修订: 2022-01-25