「计算广告」读书笔记

笔记摘要


展示量合约仍然是比较传统的交易模式,但是从技术层面上看,这种模式的出现实际上已经反映了互联网广告计算驱动的本质:分析得到用户和上下文的属性,并由服务端根据这些属性及广告库情况动态决定广告候选。

这一商业模式的出现,需要有一系列技术手段的支持,这些手段主要包括受众定向、流量预测和担保式投放等。其中受众定向是在线广告非常重要的核心问题,被各种广告产品广泛使用,


随着标签数量的增加,供给节点的数量会以指数速度上升,而每一个供给节点的流量当然也就迅速收缩。当节点的流量过小时,对其进行相对准确的预测就变得相当困难,这时上面所说的方案就会就会变得完全不可行。

因此,展示量合约这类广告产品在人群标签非常丰富和精准时是无法有效地运作的,而这正是竞价广告产品的原动力之一。


Yahoo!的展示广告分为两个产品体系:GD和非担保式投送(Non-GuaranteedDelivery,NGD)。前者是面向品牌的合约广告,而后者包括了广告网络、程序化交易等多种产品。


可知,竞价交易模式的本质是将量的约束从交易过程中去除,仅仅采用“价高者得”的简单决策方案来投放每一次广告。

竞价顺应了定向广告向精细化发展的趋势要求,也为大量无法用合约售卖的剩余流量找到了可能的变现渠道,使得大量中小广告主参与在线广告的可能性和积极性大大增强,也使得在线广告的商业环境与传统广告产生了本质区别。


搜索广告竞价的标的物是竞价关键词(bidterm),用户输入的查询(query)通过与关键词相匹配来确定是否可以触发该条广告。

匹配的方式及可以采取简单的精确匹配,也可以有更多的扩展方式,查询扩展也是搜索广告的一项比较关键的产品策略。


我们认为,搜索广告实际上是比信息流广告更加重要的原生广告起源,而且搜索广告的一些重要特点可以被借鉴到原生广告平台的产品之中。


在线广告竞价市场最常见的定价策略是GSP方案;另外有一种VCG(Vickrey-Clarke-Groves)定价策略。

  • 1.广义第二高价(GSP)先来看看什么叫第二高价(secondprice)[74]
    。所谓第二高价,指的是在只有一个位置的拍卖中,向赢得该位置的广告主收取其下一位广告主的出价,这样的拍卖也叫作Vickrey拍卖。
    在搜索广告这种有多个位置的拍卖过程中,很容易直觉地将第二高价策略推广成下面的策略:对赢得每一个位置的广告主,都按照他下一位的广告位置出价来收取费用,这就是广义第二高价[30]。第二高价和广义第二高价的直觉合理性在上面已经有所解释。

但是实际上,第二高价是单位置拍卖时的最优定价策略,然而广义第二高价却不是多位置拍卖时的最优定价策略(最优策略是下面要介绍的VCG定价)。虽然并非理论上最优,广义第二高价却有着实现简单、容易向广告主解释等诸多操作中的优点,因此在实际的竞价广告系统中是最主流的定价策略。

  • 2.VCGVCG定价[74,24,37]是Vickrey、Clarke和Groves在研究竞价系统均衡状态时得到的一种理论上较为优越的定价策略。其基本思想是:对于赢得了某个位置的广告主,其所付出的成本应该等于他占据占据这个位置给其他市场参与者带来的价值损害。

确定MRP是竞价广告重要的产品策略,MRP定得过低或过高都不利于整个市场的收益最大化。一般来说,当竞争较充分、广告主深度足够时,MRP可以设置得比较高;反之则应降低。市场保留价的设置有两种方法,一是对整个竞价市场采用同样的保留价格,二是根据不同标的物(如搜索广告里的关键词)的特性设置不同的保留价格。如果按照后一种方法设置,显然应该对那些竞争程度较激烈的关键词设置比较高的MRP。


广告网络存在CPM、CPC和CPS等不同的结算方式,不过最主流的方式是CPC。

我们有必要从计算的角度分析一下CPC结算的合理性:首先,从需求方来看,既然是各种媒体的不同广告位聚合在一起售卖,广告主无法知道每个媒体上广告的具体位置。而位置对于广告的曝光效果影响巨大,因此实际上广告主根本无法评估每次展示的出价,而在点击上出价,这个问题就没那么严重了。

另外从供给方来看,由于淡化了广告位的概念,并且聚合了多个媒体的流量,广告网络可以接触到同一个用户比较丰富的网络行为,并且知道每次展示所在的媒体与广告位位置,所以比广告主更容易估计点击率。

根据第1章中的讨论,由广告网络负责估计点击率,需求方根据对点击价值的估计来出价,是最合理的市场分工。


广告网络存在CPM、CPC和CPS等不同的结算方式,不过最主流的方式是CPC。

我们有必要从计算的角度分析一下CPC结算的合理性:首先,从需求方来看,既然是各种媒体的不同广告位聚合在一起售卖,广告主无法知道每个媒体上广告的具体位置。而位置对于广告的曝光效果影响巨大,因此实际上广告主根本无法评估每次展示的出价,而在点击上出价,这个问题就没那么严重了。

另外从供给方来看,由于淡化了广告位的概念,并且聚合了多个媒体的流量,广告网络可以接触到同一个用户比较丰富的网络行为,并且知道每次展示所在的媒体与广告位位置,所以比广告主更容易估计点击率。根据第1章中的讨论,由广告网络负责估计点击率,需求方根据对点击价值的估计来出价,是最合理的市场分工。


竞价需求可以分解为两个基本问题:一是如何挑选合适的目标人群,二是如何对各个目标人群给出合适的出价。由于竞价广告平台的决策过程对于需求方来说是个黑盒子,要解决好这两个问题其实并不容易。


RTB的产生,使得广告市场向着透明的比价平台的方向发展,这样的平台就是广告交易平台,即ADX,其主要特征即是用RTB的方式实时得到广告候选,并按照其出价简单完成投放决策。与广告交易平台对应的采买方,我们称为需求方平台即DSP。

在这样的交易市场中,需求方对于流量的选择和控制能力达到了极致,因此其技术和算法的挑战也相当大,而供给方则变成了简单的比较平台。

到现在为止,媒体至少有四种常用的广告变现选择:担保式投送的合约售卖方式、自营广告网络、托管给其他广告网络、通过RTB变现。


以外,RTB的产生和发展实际上还催生了另外一个更加重要的市场:数据加工和交易市场。开放的交易模式使得广告主可以自由地使用各种数据指导投放,而RTB过程又为附带的数据传送提供了天然的基础设施。

因此,在程序化交易时代,数据加工和交易规模化地发展了起来。作为数据加工与交易的两个关键产品:数据交易平台(dataexchange)和数据管理平台DMP分别从第三方数据和第一方数据入手,为市场提供了有价值的数据源或数据加工服务。了解在广告中的数据交易逻辑,对于各行业大数据变现的落地都有十分重要的指导意义。


广告交易平台,即ADX,是程序化交易时代的关键产品,它负责负责将媒体流量以拍卖的方式售卖给DSP,可以类比于证券市场中的交易所。

与ADX相对应,以RTB方式购买广告的产品形态就是需求方平台,即DSP。这一产品的核心特征有两个:一个是RTB方式的流量购买,另一个是需要支持需求方定制化的用户划分。这两个核心特征其实是同一问题的两个方面:为了能够按需求方定制化的用户划分采买广告,需要市场开放竞价接口;而如果仅仅根据供给方定义的用户划分来采买,那么像广告网络那样的非实时竞价就够了。


重定向是在线广告中最早产生,也最广泛使用的一种定制化标签。它的概念很简单,即把那些曾经对广告主服务发生明确兴趣的用户找出来,向他们投放该广告主的广告。

在不同的广告类型上,重定向主要有两种目的。(1)用于品牌广告。当用户已经选择过某品牌的服务或产品后,如果在比较高质量的媒体上看到该品牌的广告,他会进一步肯定自己决策的正确性,从而对该品牌的认知度也大大加强。这种用途下,应当以宣传品牌而不是具体产品为主要诉求。

(2)用于效果广告。当用户曾经考虑过某种产品,但没有完成最终转化,通过在线广告将这个用户找回,点击率和转化率都会明显高于平均水平。如果用户已经选择了该产品,那么可以利用推荐技术为他推送相关的产品广告。


由于数据规模的要求,它们一般都采用检索(retrieval)加排序(ranking)这样类搜索的系统架构,因而这两种系统有非常多的相似之处。个性化系统与搜索系统的主要差别在于大量的用户特征的使用。


计算广告并不是一门独立的学科,它更应该被看成是一个工业界的具体问题。

我们将重点关注三个相关领域的背景知识:信息检索(InformationRetrieval,IR)、最优化(Optimization)和机器学习(MachineLearning,ML)。


「10章以后内容需要详细阅读」