DSP机器学习及算法机制_上【技术类】

通过上述优化要点《上》《下》《常见定向优化设置》的介绍,我们会发现有很多很多的因素会影响到广告投放的效果,而且这些因素之间也常常是互相干扰的。这样一来我们就会发现单纯靠人脑、人工模式,已经很难持续地、7X24小时的、不吃饭不睡觉地、不间断地进行相应的分析比对,调整优化,并进而根据调整反馈的结果闭环持续优化的工作。这就需要使用技术手段、机器学习、模拟人工智能的方式,用机器、程序代替人完成那些重复性的逻辑判断工作。下面我们将对DSP的这些自动化程序化的模块,例如:内置DMP人群标签算法、智能推荐引擎、防作弊等进行介绍。


1. 内置DMP人群标签算法

DSP为了完成复杂的投放逻辑及大数据的处理,并运用大数据机器学习的手段,通过计算机自动化地去完成广告投放,首先就需要建设自己的大数据DMP系统来支持后续的智能算法推荐引擎。如图7-11所示,DSP建立内置DMP来对广告竞价做辅助决策支持。DMP是DSP的大脑,指导DSP根据历史的广告数据及闭环回收的用户数据给用户打上标签,并结合实时广告请求中的数据,对广告曝光机会进行价值预测及出价指导。

图7‑11 DSP内置DMP辅助竞价决策示意

那么大家会很好奇,DSP的大数据DMP系统,是如何根据用户行为给每个个体打上人群标签的。我们一般把机器学习的方式分为两大类:监督式学习(supervised Learning)和非监督式学习(unsupervisedLearning)。要区分两者很简单,也非常的重要。


  • 监督式学习(也有称为“回归或分类算法”的):

什么是监督式学习呢?用分类算法为例打个比方。这就好比事前我们已经知道人群标签该有哪些(如上文中按商业营销诉求对受众人群属性的划分),但是每个个体身上的标签是什么那还是未知的。而我们有的是这些个体在网络上的各种行为:例如:浏览过内容的URL、点击过的广告、留过信息的表单、购物车中的商品、购买的商品等等。在监督式学习中,我们可以将已规划好的人群标签,先打到各种不同的行为数据中。例如:浏览女性化妆品URL的行为打上“女性”、“时尚”等等这些标签、购买刮胡刀产品的行为打上“男性”、“个人护理用品”等等这些标签。然后再让计算机,通过将行为上的标签,同时也打到产生该行为的个体身上去。到这里大家可能会问啦,刚刚举的那两个例子中的标签具有一定的互斥性(“男性”Vs“女性”),那么如何确定最终该打上哪些类的标签呢?实际操作中往往是以权重的方式,来处理这些互斥性的标签。我们收集到的每个个体的行为数据是海量的,那么个体被打上标签的次数自然也是海量的。虽然被无数次的打上标签,但总有一些标签被打的次数是重复的,这样我们就可以在这些标签上进行计数(即:加权重)。从而我们可以按每个个体身上的标签按“计数量(权重)”从大到小排序,这样就能找出这个用户身上典型行为特征(即权重较大)的那些标签族。然后就可以使用这些人群标签去定向这些人群做广告投放,或根据这些标签来进行进一步的数据比对分析和学习。


  • 非监督式学习(也有称为“聚类算法”的):

什么是非监督学习呢?同“监督式学习”比对来说的话,就是事前不知道特征分类的答案,无法在事前就规划好标签分类。只能通过将相似的行为特征聚合在一起。找出这类受众或访客最典型的行为特征族(我们有的时候也会使用离线模型来存储这些特征族的数据,离线是先对在线而言的,离线即事前已存储好备用的,而在线即每次广告请求来的时候实时动态计算得出的。)。然后可以直接运用这些离线模型的特征,指导竞价及智能推荐。或者还有一种做法就是,给这类行为特征族定义一些标签,再运用上述的监督式学习的方式给更多的用户打上这类标签,甚至通过Look-alike的方式去寻找潜客。


当然还有一些介于上述两种模式中间的变种模式的学习方式,例如:

  • 半监督式学习:即输入数据部分类别有部分事前已知,而仍有部分没有被事前已知,介于监督式学习与非监督式学习之间。常见的半监督式学习算法有支持向量机等等。
  • 强化学习:在这种学习模式下,输入数据作为对模型的反馈,不像监督模型那样,输入数据仅仅是作为一个检查模型对错的方式,在强化学习下,输入数据直接反馈到模型,模型必须对此立刻作出调整。常见的强化学习算法有时间差学习等等。

更多关于各种机器学习算法的原理、特点,适用场景等等,以及《样本训练》《回归验证》等等的实操流程已曾经介绍过了。这里就不再展开。


(转载请注明出处:微信订阅号:ad_automation)

文字表现力有限,欢迎参加《9月9日“DSP上”专题【线下大课堂】》面对面为您答疑解惑讲透您关心的问题。

欢迎购买作者刚出版的《程序化广告实战》正版书系统化学习

文章被以下专栏收录

    分享程序化广告实战系列基础知识及经验,让更多入门同学更熟练运用程序化,推动程序化行业更加繁荣。让大家尽量少走弯路、少踩坑