数据漫游--数据分析及数据指标体系

不久前,还在考虑报一门优达学院的「商业决策」课程,不过现在,这个课程变得可有可无了。

商业决策的最重要的是什么呢?我觉得不是获取数据、清晰数据这样基本的技能。> 技术流的老司机,都是左手R右手Python,溜得飞起。学会了当然很棒,不会也没关系。
更重要的是,数据分析不是技术流,而是一种思维习惯。它能帮你梳理业务,找到方向,达成目的的数据分析,才是真的数据分析。

相比之下,原本学习的统计思维和合适的数据分析方法,甚至寻找合适的业务数据指标都是更加重要的是事情。

精细化运营的大数据时代,每个互联网从业者都需要:

  • 充分理解数据指标体系搭建的目标
  • 设计自身科学的产品数据体系
  • 了解公司数据上报规范和数据存储计算能力
  • 掌握数据分析、数据挖掘和数据可视化的技能

数据分析的三个基础方法:

  • 趋势分析
  • 对比分析
  • 细分分析

趋势分析

一般而言,趋势分析适用于产品核心指标的长期跟踪,比如DAU、DNU、点击率、留存率等。
简单的数据趋势图并不算是趋势分析,趋势分析需要明确数据的变化,并对变化原因进行分析。
在进行趋势分析的时候需要明确两个概念:同比、环比。
同比:与历史同时期比较,例如今年第1月与去年第1月相比较。
环比:环比是连续2个单位周期内的量的变化比,例如今年2月与今年1月数据的对比。

趋势分析的核心目的是对趋势做出解释,解释趋势线中明显拐点的原因,从而帮助业务方及时发现问题。

对比分析

从数据趋势变化独立地看,在很多情况下并不能完全说明问题。

对比分析,就是给孤立的数据一个合理的参考系,否则孤立的数据毫无意义。对比分析典型的应用场景就是A/B test。A/B test的关键是保证两组中只有一个单一变量,其他条件保持一致。比如测试首页的改版效果,就需要保证来源渠道一样,用户质量一样,上线时间保持相同,这样测试出来的数据才有意义。

新老版本迭代的时候,我们一般列出一些指标,来评估版本迭代的好坏。比如访问频次、使用时长、启动次数、关键事件达成率、留存率….我们一般采用对比方式是在新版本发布前后,对比新版本用户和老版本用户各个数据指标前后的差异。

在分析过程中,可能经常得出的结论是:新版本的数据优于老版本的数据。然而真的是这样么?

通常情况下,喜欢升级新版本的用户都是最活跃的用户,因为他们本身对产品的依赖度强,使用频度高,升级的机率自然就大。所以在做此类数据分析,最好选择两个版本发布初期的新用户,保证对比指标之外的其他因素尽可能保持一致。

细分分析

“不细分无分析!”
在当前流量红利逐步消逝的时代,笼统的统计和分析已不能满足需求,我们更迫切需要以数据驱动精细化运营,需要对用户行为的每个点进行细分,才能挖掘到隐藏在其行为背后的真正影响因素,常见的RFM模型、漏斗分析最基础的原理就是细分分析。

细分分析一般有两种,一是逐步细分分析,二是维度交叉分析。

  1. 逐步细分分析
    逐步细分,顾名思义,是根据分析要求由粗到细、由浅入深,逐步进行细分的过程。当然,这里的步骤有多种解释,可以理解为用户行为分析中的漏斗分析步骤,比如第一步是什么,第二步是什么;也可以理解为对维度进行分解的步骤,比如按地区逐步细分,中国可以细分为北京市、广东省、河北省等省市,广东省又可以细分为广州市、深圳市等,广州市还可以继续往下细分到各区、县等。

  2. 维度交叉分析
    维度交叉分析,即根据不同的维度进行交叉细分,常见的综合交叉分析应用有四象限分析法、RFM模型等。
    四象限分析法:按照两个维度交叉分析,在四个象限中对所有内容进行拆分,一般斜对的两个象限(如第一象限和第三象限、第二象限和第四象限)是相对立的,而且是壁垒分明的。如常见的获客渠道分析,需要按照质量和数量两个维度综合交叉分析,将所有渠道按照高质量低数量、高质量高数量、低质量低数量、低质量高数量这四个象限进行分析归类,就能选出ROI最高的推广渠道。

RFM模型:按照三个维度对用户进行划分,分别为Rencency(最近一次消费),Frequency(消费频率)、Monetary(消费金额)。(更多有关该模型的内容请见《06浅谈「用户分层」与「用户分群」》)

细分分析是一个非常重要的手段,多问一些为什么,才是得到结论的关键,而一步一步拆分,就是在不断问为什么的过程。

数据指标体系

什么是数据指标体系

数据指标体系就是将统计指标系统性地组织起来。

指标体系是由指标和体系两部分组成。

  • 指标(也称度量)是量化的数值,指标包括用户数、次数、人均次数、时长、点击率、转换率、渗透率、留存率、成功率等。
  • 体系是由维度组成,维度是指人们观察、思考与表述某事物的“思维角度”,维度有层次有属性,如用户数中的新老用户、用户城市分布,又如设备分布、版本分布都是维度。维度是数据指标体系的核心,没有维度,单纯说指标是没有任何意义的。

数据指标体系搭建步骤

数据指标体系的搭建过程,整体来讲分为四个步骤:

  1. 设目标

设立目标是整个体系建立的第一步,如同打地基一样至关重要。未来数据指标体系的模型可用性和迭代程度,很大程度取决于这一步的方向。目标大体上可分为五类,分别是:表现现状、反应问题、预测趋势、评估目标和调整决策。

  1. 定指标

有了方向就需要划定指标,根据划分标准,指标大体分为三种:关键指标、衍生指标和自建指标。在大量的指标中,同学们需要根据这三种指标结合分析目的进行配比。
指标确定的三个步骤:

1. 定关键指标。根据流程关键点选择指标,并且该指标能够很好地反应业务特征和问题本质。
2. 塑造衍生指标。对关键指标进行重构或计算,辅助关键指标实现对问题的阐述,如关键指标的比值、均值等。
3. 通过建立自建指标验证关键指标的有效性。
  1. 建模型

建模型其实就是:先确定一个业务目标,将该目标尽可能地进行细化拆解,找出会对目标产生影响的各项指标,并通过某些计算逻辑将这些指标关联起来的过程。

一个好的模型具备:

1. 系统性:即该模型可以全方位系统化地评估目标的实现程度;
2. 可扩展性:是指可扩展的能力,可以通过不断地迭代,提升解决问题的效率;
3. 易操作性:即在实际的统计和分析中该模型易于落地执行,也利于问题的发现。
在纷繁复杂的各种模型中,有些是比较成熟的模型可以直接“拿来主义”,但有些则需要根据业务实际情况进行调整或重建。
  1. 采数据

数据搜集比较费时,需要根据实际情况,在保障数据质量的同时,提高构建数据指标体系的效率,在减少时间成本的前提下优雅地解决问题。

总之,数据指标体系建立的过程,是一个实践与优化的过程。我们要以事件为核心,圈定范围,明确逻辑,挖掘根源。这样,数据指标体系对于分析的价值才能最大化。

三个数据模型来帮助我们搭建数据指标体系

Web版:PULSE模型介绍

  • Page view:页面浏览量
  • Uptime:响应时间
  • Latency:延迟
  • Seven days active user:7天活跃用户数
  • Earning:收益

PULSE模型是衡量用户体验的重要指标,也经常被用来度量产品的整体表现。举例来说:如果一款产品响应时间为10秒,那么大部分用户会放弃这款产品;如果一款产品7天活跃用户数仅占全部用户数的1%,那么将很难实现用户的持续增长;如果一款产品有很好的流量却没有办法变现,那么产品将无法长久经营。

用户侧:HEART模型介绍

  • Happiness:愉悦度
  • Engagement:参与度
  • Adoption:接受度
  • Retention:留存率
  • Task success:任务完成度

HEART模型,是由Google用户体验研究团队设计,衡量提升用户体验的框架模型。我们之所以选择介绍这个模型,是因为它把产品目标与创建指标体系相关联,并包含了宏观和微观的衡量方式。

愉悦度: 是指交互设计给用户带来体验的满意程度。具体指标包括可用性、易用性、推荐意愿、视觉感受度等,指标数据可通过调研问卷得到。 最著名的🌰就是,Google根据愉悦度指标,做出了关停了整个Google Reader的决策。

参与度: 是指用户参与互动的程度。具体指标包括参与时长、频率、深度和参与会话数(取决于产品形态),如访问频率、访问深度、页面停留时间、产生UGC的数量,日活跃度、周活跃度、月活跃度等指标。指标数据可以选择事件埋点并监控数据获得。

接受度: 是指用户对一个功能或者一组功能的接受情况,又或者是新用户接受一个产品的情况。具体指标需要考虑产品功能,比如电商网站的购买、微信发消息发朋友圈、支付宝转账付款、游戏充值、新闻评论等等,我们可以在一定时间范围内观察产品功能的渗透率

留存率: 顾名思义是用户的次日留存率、周留存率、月留存率等数据指标,这需要结合参与度和接受度综合来评估。

任务完成度: 是指任务完成效率和效果。具体指标包括任务完成率、完成时间和错误率,比如从开始注册到最后注册完成的比例和时间,游戏新手任务的完成率和完成时长,用户填写产品反馈、上报错误信息等等。

产品侧:GASM模型介绍

  • Goal:目标
  • Action:优化
  • Signal:表现
  • Metric:指标
  • GASM是对Google提出GSM指标量化模型的更新,它以目标为结果,通过对目标的设定来倒推过程,精准设定指标体系。

目标:识别明确目标。

- 业务目标、用户目标、产品目标是什么?
- 用户要完成什么任务?我们希望他们按照什么路线走?希望他们执行什么操作?

优化:具体的优化行为。

- 优化增加点,如运营活动、运营文案、产品改进

表现:推衍相对的行为和表现。

- 什么用户行为/态度指示了目标达成?
- 什么样的感受与目标失败/成功相关?

指标:找出关键指标。

- 与合作方充分沟通,确保口径及对象清晰无歧义
- 考虑每个指标的价值,清楚它们的意义
- 少而精,重点关注3-5个最核心的指标

⚠️在指标的选择过程中,需要注意三点:
第一,尽量避免设定同质指标(如,用户在某页面中的点击率和跳出率就是同质指标。用户进入某页面之后只有两种可能性:进行点击操作和不进行任何点击操作【即:跳出】。该页面的点击率和跳出率均受用户点击行为的影响);
第二,相比于绝对值,应该更关注相对值。因为在大部分情况下相对值比绝对值更具有意义,如比例、百分率或者每个用户的平均值;
第三,不拘泥于已知,一些情况下需要“创造”新的指标。

GASM模型举例

我们不妨来实践一下:通过对某电影APP选座页面调研,我们发现这个页面最大的问题是选座过程中用户选座退出率奇高。

优化时,便根据GASM搭建了一套数据指标体系,形成下面表格,其中Action的部分主要由PM和UI同学担当,具体优化对象和和后续埋点也离不开可爱的RD小哥哥助力: