跳至内容

数据常青藤

人工智能、机器学习、深度学习、神经网络、模式识别、自然语言处理、图像识别…数据智能工作才是数据的未来!

  • 《Python数据分析与数据化运营》第二版出版了!
  • 《Python数据分析与数据化运营》新书上线
  • 《网站数据挖掘与分析 系统方法与商业实践》-写在2017年
  • 《企业大数据系统构建实战:技术、架构、实施与应用》

博主

宋天龙(TonySong)

大数据技术专家,触脉咨询合伙人兼副总裁,前Webtrekk中国区技术和咨询负责人(Webtrekk,德国的在线数据分析服务提供商)。

著有多部畅销书:

  • 《Python数据分析与数据化运营》
  • 《网站数据挖掘与分析:系统方法与商业实践》
  • 《企业大数据系统构建实战:技术、架构、实施与应用》

出版物

  • 京东
  • 当当
  • 亚马逊

  • 京东
  • 当当
  • 亚马逊

  • 当当
  • 亚马逊
  • 京东

微信扫一扫

分类目录

  • 《Python数据分析与数据化运营》 (32)
  • 《Python数据处理、分析、可视化与数据化运营》 (1)
  • Python常用数据工作库 (16)
    • NumPy (1)
    • Pandas (1)
    • Python工具箱 (12)
  • 应用案例 (2)
  • 数据读取 (3)
  • 数据集 (4)
  • 数据预处理 (10)
    • 数据标准化 (1)
    • 数据转换 (1)
    • 特征选择 (1)
    • 降维 (4)
  • 监督式学习 (5)
    • 分类 (1)
    • 判别分析 (2)
    • 回归 (1)
  • 非监督式学习 (16)
    • 异常检测 (3)
    • 时间序列 (1)
    • 混合高斯模型 (1)
    • 神经网络 (1)
    • 聚类 (7)

标签

  • AP
  • ARIMA
  • ARMA
  • bandwidth
  • datasets
  • dot
  • GMM
  • ICA
  • K-Means
  • kmeans
  • K均值
  • lambda
  • LDA
  • matplotlib
  • MiniBatchKMeans
  • Numpy
  • pandas
  • PCA
  • PIL
  • prettytable
  • PyCharm
  • Python
  • Python数据分析与数据化运营
  • sklearn
  • statsmodels
  • SVM
  • SVR
  • 主成分分析
  • 切片
  • 勘误
  • 因子分析
  • 工具库
  • 数据分析
  • 数据化运营
  • 数据源
  • 数据集
  • 日志解析
  • 相关系数
  • 矩阵乘法
  • 离群点检测
  • 第三方库
  • 缺失值填充
  • 聚类
  • 转置
  • 降维

分类:数据转换

标签 资源下载:
  • 《Python数据分析与数据化运营》源代码、勘误、常见问题
  • 《Python数据处理、分析、可视化与数据化运营》源代码、勘误、常见问题

数据预处理-清洗转换

当数据质量校验完成后,针对有问题的数据要进行的是数据清洗和转换,另外还包括对正常数据的转换。数据清洗的主要作用包括:纠正错误、删除重复项、统一规格、修正逻辑、转换构造和数据压缩。

继续阅读数据预处理-清洗转换

发布于 2017年6月16日2017年7月9日分类 数据转换标签 Python、工具库、第三方库于数据预处理-清洗转换留下评论
自豪地采用WordPress