分类标签归档:数据分析

硬广告渠道——选自《电商流量数据化运营》


2.4.1 硬广告概述

硬广告一般是指直接介绍企业品牌、商品、服务、内容的传统形式的广告,通过直接“灌输”的方式将信息广而告之。传统场景下,硬广告主要在电视、广播、报纸杂志、户外等媒体上投放;互联网场景下,硬广告主要在各类门户、导航站甚至APP等媒体上投放。互联网硬广告的方式包括开屏广告、banner广告、横幅广告、异形广告、贴片广告、植入式广告等。

> 本节的硬广告侧重于没有人群定向或只根据几个比较粗粒度的条件进行投放的广告方式,且以CPT、CPM、CPC为主要计价方式的广告媒体。

2.4.2 为什么硬广告“不精准”,我们依然要投

在强调精准营销的时代背景下,目前硬广告渠道的市场费用,

继续阅读

如何分析渠道效果的边际效应——选自《电商流量数据化运营》


6.3.1 渠道效果边际变化规律概述

营销渠道效果的一个基本规律是,当营销投入变化时,其产生的营销效果也是变化的,且变化可能不是线性的,而是呈现特定的边际效应。例如:当广告费用持续增加时,转化率在缓慢下降;当流量规模增加时,单位流量的成本却在上升。找到不同渠道的边际效应规律,有利于增加对渠道的认知并能更好的控制营销资源的投入并使企业回报最大化。

6.3.2 分析渠道回报效率的边际递减效应

随着营销渠道广告费用的增加,其回报效率可能出现边际递减效应,回报效率可以是转化率、ROI等转化效率类的指标。例如,当广告费用在10万量级时,每1000块钱能带来10个订单;当广告费用增加到100万量级时,每1

继续阅读

渠道效果影响因素研究——选自《电商流量数据化运营》


在渠道效果分析中,找到影响效果转化的主要因素是重中之重。它能直接帮助营销人员更好的了解渠道转化的影响因素,以及如何进行渠道效果优化和提升;同时,还可以基于分析得到的业务规则,直接应用到营销投放和操作过程,因此落地性和价值度都非常高。

该节内容可应用于任何带有转化目标的渠道中,且转化的定义可以包含任何目标场景,例如:

  • 动作场景:提交订单、按钮点击、线索填写、注册、登陆、抽奖等事件。
  • 非动作场景:停留超过30秒、看过超过10个页面、浏览过特定页面等过程性行为。

7.2.1 渠道效果影响因素概述

在“4.1.4 基于Lookalike的人群规则实现投放人群管理”中介绍了如何通过模型提取营销目标人

继续阅读

3.12.4 自然语言文本预处理


说明:本文是《Python数据分析与数据化运营》中的“3.12.4 自然语言文本预处理”。 -----------------------------下面是正文内容--------------------------

与数据库中的结构化数据相比,文本具有有限的结构,某些类型的数据源甚至没有数据结构。因此,预处理就是要对半结构化或非结构化的文本进行格式和结构的转换、分解和预处理等,以得到能够用于进一步处理的基础文本。不同环境下,文本所需的预处理工作内容有所差异,大体上分为以下几个部分:

基本处理

根据不同的文本数据来源,可能涉及到的基本文本处理包括去除无效标签、编码转换、文档切分、基本纠错、去除

继续阅读

3.12.3 图像的基本预处理


说明:本文是《Python数据分析与数据化运营》中的“2.2 使用Python获取运营数据”中的第二部分,由于本节内容较多,这里分几个文章。

2.2.2 从Excel获取运营数据

现有的Excel分为两种格式:xls(Excel 97-2003)和xlsx(Excel 2007及以上)。

Python处理Excel文件主要是第三方模块库xlrd、xlwt、pyexcel-xls、xluntils和pyExcelerator,以及win32com和openpyxl模块,此外Pandas中也带有可以读取Excel文件的模块(read_excel)。

基于扩展知识的目的,我们使用xlrd模块读取Ex

继续阅读

3.11 数据处理应该考虑哪些运营业务因素


说明:本文是《Python数据分析与数据化运营》中的“3.11 数据处理应该考虑哪些运营业务因素”。 -----------------------------下面是正文内容-------------------------- 数据处理工作不仅依赖于数据工作者的数据经验,也需要考虑实际的运营业务因素。这种兼顾两种工作逻辑的工作方式会帮助数据工作少走弯路并降低数据项目失败的可能性,还有利于提高数据工作的效率和产出效果,真正让运营理解数据、应用数据并驱动业务。 数据处理时应该考虑的运营业务因素包括固定和突发运营周期、运营需求的有效性、交付时要贴合运营落地场景、专家经验、业务需求的变动因素等。

3.

继续阅读

3.12.1 网页数据解析


说明:本文是《Python数据分析与数据化运营》中的“3.12.1 网页数据解析”。 -----------------------------下面是正文内容--------------------------

本节通过一个稍微复杂一点的示例,来演示如何抓取并解析网页数据。之所以说复杂,是因为本节中会出现几个本书中未曾提及的知识和方法,从代码数量来看也会比之前的示例稍微长一点。

本示例中,将使用requests、bs4、re、time库进行网页数据读取、解析和相关处理。

示例的目标是抓取亚马逊中国网站苹果手机和配件的价格,用于做竞争对手的标杆商品价格监控。注意:本示例仅做学习之用。

在抓取和解

继续阅读

3.12.2 网络用户日志解析


说明:本文是《Python数据分析与数据化运营》中的“3.12.2 网络用户日志解析”。 -----------------------------下面是正文内容--------------------------

网络用户日志属于非结构化数据的一种,其解析方法根据不同的服务器配合和跟踪实施需要自定义模块,本节将以一个示例来演示如何进行日志解析。

本示例中,将使用正则表达式配合自定义函数模块实现日志解析功能。数据源文件traffic_log_for_dataivy位于“附件-chapter3”中,默认工作目录为“附件-chapter3”(如果不是,请cd切换到该目录下,否则会报“IOError

继续阅读

3.10 离散化,对运营数据做逻辑分层


说明:本文是《Python数据分析与数据化运营》中的“3.10 离散化,对运营数据做逻辑分层”。 -----------------------------下面是正文内容--------------------------

所谓离散化,就是把无限空间中有限的个体映射到有限的空间中。数据离散化操作大多是针对连续数据进行的,处理之后的数据值域分布将从连续属性变为离散属性,这种属性一般包含2个或2个以上的值域。

离散化处理的必要性:

  • 节约计算资源,提高计算效率。
  • 算法模型(尤其是分类模型)的计算需要。虽然很多模型,例如决策树可以支持输入连续型数据,但是决策树本身会先将连续型数据转化为离散型数据,因

继续阅读

3.6 数据化运营要抽样还是全量数据


说明:本文是《Python数据分析与数据化运营》中的“3.6 数据化运营要抽样还是全量数据”。 -----------------------------下面是正文内容--------------------------

抽样是从整体样本中通过一定的方法选择一部分样本,抽样是数据处理的基本步骤之一,也是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。

3.6.1 什么时候需要抽样

抽样工作在数据获取较少或处理大量数据比较困难的时代非常流行,主要有以下几方面背景:

  • 数据计算资源不足。计算机软硬件的限制是导致抽样产生的基本原因之一,尤其是在数据密集的生物、科学工程等领域,不抽

继续阅读