数据产品指北(一): 埋点

所谓“巧妇难为无米之炊”,所有的数据工作,前提一定是有数据。埋点作为获取数据的常用手段,其概念本身我们并不陌生。埋点所采集的数据,是后续数据分析,搭建数据产品等工作的基础,因此,这个系列也会先从埋点开始。

数据产品指北(一): 埋点

埋点的本质是记录事件

通过埋点,我们希望记录的其实是用户背后的行为事件。主要的埋点事件分为三种:点击、曝光和停留

1. 点击事件

即用户在页面上的每一次点击,都会记录一次数据。

2. 曝光事件

每向用户展示一次页面,便会记录一次数据。这里可以对首次进入和刷新进行区分。

3. 停留事件

主要用于记录用户在单个页面的停留时长。通过记录用户进入页面的时间点和离开的时间点,可计算出停留时长。

而事件所反映的是用户的行为,有时候一个事件或多个事件组合的背后,可以挖掘出更多的用户行为,需要结合实际业务进行定性分析。通过这三种事件,我们可以组合并计算出一系列所需的指标,例如跳出率、转化率等。

埋点的主要方式

根据埋点终端可分为客户端前端埋点和服务器后端埋点。

前端埋点主要有可视化埋点、无埋点和代码埋点三种。整体来看,三种方式的埋点成本递增,可记录的数据量和数据深度也递增。

1. 可视化埋点

记录前端设置的页面元素和其操作的对应关系。可直接以前端页面可视化的方式展示相关数据。例如统计页面PV、UV、点击等宏观指标,能满足基本的数据分析需求。在设置时,通过圈选页面具体位置等操作设置埋点事件。

2. 无埋点

绑定页面上的控件,触发事件时通过采集SDK上报相关数据。无埋点可以对全量的交互数据进行标准化采集,因此也有“全埋点”的说法。个人认为,可以把可视化埋点和无埋点都归为非代码埋点,具有相似的优劣性。都能简单、方便、准确地完成埋点操作,对应的在收集数据深度和灵活性上存在不足。

3. 代码埋点

由研发人员在程序中写入代码实现,通过触发具体动作后程序自动上报数据。代码埋点可以采集更细粒度的数据和与业务强相关的信息,是精细化分析必备的埋点方式。例如电商网站在记录用户加购行为时,还希望包含具体加购商品等相关信息,就需要采用代码埋点。其缺点自然是开发成本较高,而且有可能出现漏埋、错埋,对团队水平要求也更高。

前端埋点整体更适合产品功能相对简单的运营初期。除去前端埋点,还有前面提到的后端埋点,通常以代码埋点为主。后端埋点可收集全量网络请求数据,不限于在app中的行为。其实时性更强,数据准确性也更高。因此后端埋点其实是更被推荐的。

常见情况是公司会同时结合前端埋点和后端埋点。能通过后端埋点采集的数据,尽量使用后端埋点,特别是一些业务关键数据(订单、支付等)。前端埋点主要采集一些常规的操作行为,和与后端没有交互的纯前端事件。两种埋点都存在,也能方便进行数据的交叉验证和互补。例如在一方数据出现问题时,还可用另一方数据替代。

数据不准确的原因

由于前端埋点和后端埋点的实现方式不同,统计到的数据通常会有差异,只要范围可容忍,不用过于纠结。当然,在出现差异较大时,则有必要质疑数据的准确性了。造成数据不准确的原因,主要有以下几种情况。

1. 网络异常

这是最常见也最直接的原因之一。网络的拥堵、抖动、丢包等都会导致数据的异常。

2. 统计口径不一致

同一指标可能存在不同的定义方式和统计口径,导致实际数据产生误差。这就需要数据管理系统来保证数据质量了,如果还有机会写到数据管理系统这一篇,届时再详述。

3. 代码质量问题

一方面,由于手机操作系统版本、开发框架、程序本身等问题可能导致SDK在某些情况下无法被正常调用或重复调用。另一方面,埋点本身也可能出现了漏埋、错埋的失误。

数据埋点实例

埋点一般采用Key-Value的形式,Key表示某个事件,Value代表对应的值。同属性下的多个事件可命名为同一事件ID,通过Key-Value进行区分。这样可以在一个事件ID下区分不同维度和维度下不同的值,更重要的是,比起一个埋点一个事件的方式,Key-Value的方式具有更高的扩展性,维护成本更低。

例如对某app内上线了2个活动,并分别在2个渠道投放,想要了解2个活动的访问情况,则可设计如下埋点方式。

数据产品指北(一): 埋点

Key-Value设计

通过Page、Source和ActionType来确定一个事件,例如通过酒店入口点击活动A,可表示为ActivityA_Click_HotelButton。简化后的埋点文档如下。

数据产品指北(一): 埋点

简化埋点文档

除去以上字段,在正式的埋点文档中可能还会包含上报时机、埋点端(前端/后端、App/Web/小程序)、埋点模块、事件触发时间、用户信息、设备信息等公共属性或事件特定属性,视具体需求而定。

数据埋点就总结到这里。

参考文献

梁旭鹏. 《数据产品经理修炼手册》. 2019.03.

桑文锋. 《数据驱动:从方法到实践》. 2018.03.

本文由 新媒体之家 作者:罗老师别这样 发表,其版权均为原作者所有,文章内容系作者个人观点,不代表 新媒体之家 对观点赞同或支持,未经许可,请勿转载,题图来自Unsplash,基于CC0协议。
1

发表评论