说明:本文是《Python数据分析与数据化运营》中的“2.1 数据化运营的数据来源类型”。 数据化运营的数据来源类型包括数据文件、数据库、API、流式数据、外部公开数据和其他来源等。
2.1.1 数据文件
数据文件就是存储数据的文件,广义上,任何文件中存储的信息都可以称为数据;狭义上,数据文件中存储的是以数字或文本形式存储的结构化的数据记录,本节的范围指的是后者。
- 结构化数据文件大多来源于数据库,例如从MySQL中导出2017-01-04到2017-10-21的订单明细数据并存储为csv文件;
- 也有来源于系统或工具的工作过程或返回结果,例如Windows版本的Tesseract文字识别后的结