从每个独立用户视角所看到的视频排序,一般都会经历【内容召回→内容粗排→内容精排】的过程,利用协同过滤、机器学习、深度学习等算法/策略来确保推荐的精准度 。

文章插图
由于平台不可能直接把数千万条视频、直播与用户的兴趣进行匹配、排序,所以先通过多种策略做内容召回(比如:兴趣标签、相似用户、热门内容等),先召回有限的候选集,再进行内容排序 。

文章插图
谷歌DNN模型的目标就是在给定YouTube用户历史行为与上下文的情况下,学习 user embedding 向量u,作为输入送到 Softmax分类器,用以生成初步候选集作为视频的召回结果 。

文章插图
谷歌论文:《Deep Neural Networks for YouTube Recommendations》
召回完成后,内容排序有很多种算法模型这里就不展开了,因为我也看不太懂 。 总之,老板那句“两手都要抓,两手都要硬”,并不是想象中那么简单 。
最终,服务器向用户手机返回了排好顺序的视频,用户依次向下滑动,他的点赞、评论、观看时长等行为将被记录下来,用于未来模型训练,提升预测的准确度 。 以亿为单位海量的兴趣数据经过训练不断反哺到内容推荐与广告业务中去,呈现飞轮式增长 。
2. 计算广告如何更「高效」
刚才也提到,【计算广告】作为一项业务,其核心目标是「平衡」用户、平台、广告主三方的利益:
平台利益:Max(eCPM【千次广告展示收益】),代表单位流量售价最高,如果抖音Q2平均1000次广告展示获得的广告费是40元,环比Q1上涨10元,那说明Q2的变现效率提高了 。
广告主利益:Max(ROI),ROI=收益/CPM【千次广告展示成本】,这里的“收益”指广告主支付广告费获得的收益水平 。 例如:阿里在抖音投放1000次广告需要支付20元,平均可以获取1个新用户,1个用户1年只能为阿里带来10元的综合收益(ROI=0.5),那20元的广告费就是不划算的 。
用户利益:尽量少看广告(抖音的Ad load),即使看也是看自己感兴趣的内容 。
我们模拟一轮简化的广告分发场景:“用户看了广告主A和C的素材后都没有点击,而用户B不仅点击了广告主B的素材,并且注册成为B产品的客户 。 ”

文章插图
这一轮广告展示中,广告主A和C需要根据广告展示次数向平台付费(CPM),但他们获得客户的利益点没有得到满足,这就出现了客户收益与平台成本不匹配的问题,长期没有改善广告主自然就会停止投放 。
所以,想要满足客户的投放目标(如:合理的获客成本),就需要提高广告的点击/转化水平(CTR/CVR),这就回到了前文所说的「个性化推荐」在计算广告的应用,尽量匹配用户感兴趣的广告 。 例:给饭圈粉丝推荐Idol代言产品 。
如何持续改善广告点击/转化率(CTR/CVR)呢?
以【京东】的广告排序模型为例,用户在【搜索商品的场景】,广告点击的概率(CTR)可以描述为依赖于4个不同类型输入的函数:
Query:描述用户搜索意图 。
user(用户侧特征):描述用户的兴趣、偏好 。
item(商品侧特征):描述这个商品是否优质 。
Context(文本特征):描述用户搜索时属于怎样的场景,是上班的时候搜的还是周末搜的,此时是否有活动 。

文章插图
来源:刘鹄,《CSCNN:新一代京东电商广告排序模型》
通过构建特征工程并确定目标函数(贪心算法(局部最优)/长期回报),利用Online-Learning大量数据训练后得到CTR优化结果 。
在推送1次广告时,平台到底从海量的广告主中推哪一个,核心考量因素是eCPM(平台每千次展示的收入) = 预估点击率(p-CTR) *预估转化率(p-CVR)* 预估出价(p-Bid) 。 根据每个广告的eCPM进行排序,选出值最大的那个进行展示,如果涉及i个不同的客户则,取所有客户∑eCPM求和最大化的解 。

文章插图
来源:刘鹄,《CSCNN:新一代京东电商广告排序模型》
从产品实现的角度,平台在广告排序时需要前置预估点击率(p-CTR)、转化率(p-CVR)和出价(p-Bid),所以预估准确度决定了最终平台的收益是否真的能实现最大化 。
推荐阅读
- PS入门教程第六课-图层介绍 ps图层锁定怎么解锁
- 繁荣与衰退新手攻略玩法介绍-新手入门指南热门推荐
- 入门练字钢笔推荐 笔的种类
- 推荐几个性价比高的单反相机 新手入门单反相机什么牌子好
- 仙域轮回新手怎么玩-新手入门玩法指南您要知道知识
- 荣誉指挥官新手入门攻略-新手玩法技巧分享2020新发布
- 奇门遁甲怎么学(学奇门遁甲基础知识入门)
- 基金怎么玩新手入门 基金定投什么意思
- 钳形万用表使用基本方法 钳形万用表使用入门
- 新媒体运营的一些技巧 新媒体如何从入门到精通