DSP机器学习及算法机制_下【技术类】

吴俊吴俊

《DSP机器学习及算法机制_上【技术类】》继续下篇:


2. 智能推荐引擎

通过各种训练及机器学习,我们可以在竞价前(离线)对历史的广告请求、广告投放、点击后到站及转化等等大量历史数据,进行训练离线模型。当有广告曝光机会竞价请求,DSP被邀请参与竞价的时候,DSP方的智能推荐引擎根据广告请求的人群标签、浏览器、时间、地域、广告位尺寸等等多维度特征,并结合广告创意的特征,依据离线已事先训练好的,对不同特征效果预测的数据模型,预测该次广告展现可能产生的价值,包括到达率、点击率、点击转化率等,并根据预测来评估进行合理的出价,从而实现对目标人群的竞价购买。大体处理流程示意图如图7-12所示:

图7‑12离线模型指导竞价决策引擎流程示意

常见的推荐出价引擎策略(这些策略很多时候会交叉并用)有很多,下面罗列一些常用的算法简单介绍一下。同样也是帮助大家有一些感性认识,在日常工作实践中能知道什么场景下该选用什么算法即可。对于算法内部的详细机制也不做大篇幅的展开。

  • 流量探测:这种算法就是简单在广告请求的底价之上,加一定比例或固定的数进行出价。因为是流量探测为目的,基本是打底广告投放,这样可以训练出大量的有价值的数据(如最低成交价、成交价同胜率的分布等等)。还有一些需要大曝光的广告投放也会采用这种算法。
  • 稳定目标CPM:这是最基础的一种策略,算法会依据预测成交价、及目标CPM设定、及历史胜率来计算出价。
  • 目标CPM+CTR:这个算法是在达成目标CPM的基础上,达成CTR目标的方式类筛选流量及计算出价。
  • 稳定目标CPC:这个算法主要是通过CPC目标,依据CTR预测、及出价、及胜率模型数据反推CPM出价。
  • 目标CPC+CTR:这个算法是在达成目标CPC的基础上,并以CTR目标筛选流量及计算出价。
  • 目标CPA:这个算法会预估转化率,根据历史投放计算该点位在该广告主、该行业的转化率,过滤掉转化率较低的流量,最终以CPA期望计算出价。
  • 目标CPA+老客:这个算法会提取多维度的feature及其交叉维度,通过机器学习获取 feature权重,根据feature权重对老客进行打分排序,取top进行投放,并以CPA期望计算出价。
  • 目标CPA+新客:这个算法会根据转化数据为正样本,提取feature,根据feature得到对应广告的扩展人群,打上相应的标签然后对相似标签进行投放,并以CPA期望计算出价。
  • PDB退量控制:这个算法主要在PDB视频退量模式使用。会实时动态记录,并计算每Deal退量比,确保退量小于阀值。当然还会兼顾TA筛选及频次控制等等因素。
  • 投放速度控制:这个算法主要基于PID(比例Proportion、积分Integral、导数微分Derivative)反馈回路闭环控制。(PID控制的基础是比例控制;积分控制可消除稳态误差,但可能会增加超调;微分控制可加快大惯性系统响应速度及减弱超调趋势。运用“傅立叶变换”将流量波动波形及投放进度波形进行数学拟合的基础上来做预测。)来控制投放速度,确保均匀投放,或快速消耗等等。大体的处理逻辑示意如图7-13所示实时依据投放反馈数据,来动态运用比例、积分、微分手段及胜率的预测,控制投放速度的均匀稳定。

图7‑13均匀投放算法逻辑示意

  • AB测试:这个常用于新算法策略上线,或寻找合适的算法时,会使用该策略在真实投放中观测效果,找出最优的算法。
  • Ranking排名:这个主要是综合上述策略算法的整体调度算法,并从宏观提升整体流量利用率,及整体ROI来对各策略的得分在进行加权计算,排名得出最合适的出价者。一般权重:访客>转化>点击。




实操中通过历史数据建立数学模型过程中,不可避免地要注意到,数据中会存在一些噪音。所以常常还会加入一些人工干预,设置补偿因子及系数的方式。一方面这样做可以一定程度简化算法及模型,另一方面也大大降低对计算资源的消耗,从而降低成本、提升效率。(这也是典型的二八原则的做法:大部分80%的问题仅需要20%的投入即可解决。)


3. 防作弊

由于RTB长尾流量中的流量质量参差不齐,所以防作弊是DSP的一个十分重要的模块。一般采用通过规则引擎设置(监督学习)或关联挖掘(非监督学习)非人类流量特征,并实时进行过滤。嫌疑特征流量会被放入观察室,不可竞价,待嫌疑特征消失才可使用。如图7-14所示,那些分布较为特征集中的广告流量其很有可能存在问题。(常见的一些特征例如:单用户ID或IP地址请求间隔时长多短、某些用户请求集中在某些媒体或页面,而不是全网使用等等。)

图7‑14流量嫌疑特征示例

还有一种观点是,若从转化漏斗、结果导向来做流量价值评估的角度来看,不存在评估作弊流量或非人类流量的必要,只有对转化漏斗无效的流量。那么只要能合理运用转化漏斗模型作为广告投放的衡量目标,来设置投放算法。自然也能合理过滤掉无效的流量。


本系列文章均摘自作者刚出版的书籍《程序化广告实战》,网上的文章都比较零散,若您想系统化学习,可考虑考虑看看正版书系统化学习,各大电商网站(如:京东)均有售卖。

(转载请注明出处:微信订阅号:ad_automation)

文字表现力有限,欢迎参加《9月9日“DSP上”专题【线下大课堂】》面对面为您答疑解惑讲透您关心的问题。现场福利:可以为您的新书定制个性的签名题词。

「真诚赞赏,手留余香」
还没有人赞赏,快来当第一个赞赏的人吧!
文章被以下专栏收录
1 条评论