3

搜推策略产品十做十不做

 1 year ago
source link: https://www.woshipm.com/operate/5689657.html
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

搜索推荐到底该怎么做呢?是要照着老板说的做,还是根据用户反馈做?本文作者总结了搜推策略产品的十做十不做,并对其中的三点进行了分析,一起来看一下吧。

3MrQARoeMCtCe9fg9wpN.png

搜索推荐到底怎么做?按老板说的做,照竞品抄,根据用户反馈做、通过数据分析做?8年京东、美团搜推经验,建议大家那些该做,那些不该做的,搜推策略产品十做十不做,但要根据具体情况定。

01 硬加权不做,但柔性智能化流量调控要做

什么叫硬加权,就是给某个商品的排序直接从后面提到前面,这个叫硬加权。比如有运营来找你,说我这个东西这么好,怎么排序靠后呢,你得给我加权呀、或者是某个业务找到你,说我这个业务是今年公司重点,但流量不足呀,你得加权呀……

为什么不能硬加权,硬加权损效率呀!为什么损效率呀,用点黑话,是因为用户不Buy in呀,就是用户不点呀!

那为什么柔性智能化流量调控可以做呢?这有几个关键点,一个是前置的筛选分层,如果是电商就是精细化选品,看哪些品是预期可以多获得一些流量,也能承接得住的。

比如阿里今年双11出了一个价格力加权,就是你这个商品优惠力度大,我可以多给你流量;再比如阿里的优质商家商品流量加权,也是说这个商品有一定的潜力,我多给他一些流量,应该也能承接的住;还有就是中间的赛马机制,效率好的晋升,效率差的汰换,同时要有运营诊断指导,为什么效率差,商品价格高、没什么评论积累、主图标题不清晰等。

当然还有很多,不一一展开说了。还有一个重要的点是,对于协同部门要疏不是堵,就是你给他提供抓手,可以让他有玩的东西,然后一点一点有轶序地玩。

02 乱七八糟标签不用做,但用户商品基础标签、营销标签、人群节日标签要做

什么叫乱七八糟的标签?就是一提起推荐,大家就说你是基于那些标签推荐的, 我们能不能在商品或内容上打些标签,然后你们用呀?我们之前打的标签你们用了吗,效果怎么样?你看我们还需要打什么标签……这里说明下,标签对于推荐来讲是重要的,但不是最重要的,尤其是在大数据量的情况下。所以,不要提到推荐,大家就认为标签做好了,推荐就做好了,推荐没做好,就是标签没做好。

1. 推荐原理

回答什么是乱七八糟标签前,我先基于我的理解给大家科普下推荐原理。其实这也不能怪大家,早期推荐技术也没那么先进,然后数据量可能也不多,所以,大家就冷启的时候让你选兴趣点标签,推荐的时候根据文本标签推荐,模型上也是LR、GBDT一类的。

这就让没搞过搜推的人觉得,啊,推荐就是标签推荐,但他不知道,现在都是DNN了,都是基于用户行为推荐,基于I2I推荐,基于KNN,基于Embedding、Vector推荐,只有个别情况下,数据挖掘不到的,才会通过早期的文本标签做召回推荐。

举些例子吧,要不然,这么说,懂的人懂,不懂的人还是觉得推荐就是标签推荐,推荐没做好,就是没标签,或者标签不准,或者标签用得不好……那以电商为例,基本可以通过共购买,共点击等数据挖掘到相似或相关的商品。

比如你点击了小米的手机,那可能会推荐给你华为的手机,因为很多人点了小米后,也会点华为,甚至最后还购买了华为,这么说还是笼统,更细节是你点的是小米支持5G的,8G+512G内存+存储的、5英寸的、双摄的……那算法就通过大数据帮你找到的是华为P40\P50,而不会找到Nokia。

那你这例子不还是说推荐就是基于标签推荐的吗?这里其实又涉及到了算法可解释的问题,通常业务会问,你这排序的逻辑是什么,为什么这么排,为什么这个排前面,那个排在后面?你看给我推了这个,你看我是这样的用户,我年薪百万,怎么不给我推那个?你这个推的多Low呀,一点都不高端……那算法同学呢,一般的回答就是,呃,这是算法推荐的,是DNN深度学习的,是黑盒的,是不可解释的,我们也不知道为什么这么推;产品经理呢一般会说:啊,你点过这些吧,这是根据你的行为和画像推荐的。

2. 模型可解释

我先捞干的,理论上DNN深度神经网络是不可解释的,不像GBDT的树模型那样是可解释的,这说的是从模型的角度,什么Feature Important角度是不可解释的。但实际上任何模型也都是可解释的,因为人的选择是可解释的,人的购物决策和浏览内容的偏好是可解释的,只不过是你要根据不同人、不同时间、不同地点、不同场景、不同……太多了,这样就不好解释了,而且你还是要解释给不了解算法的人。

那这就变成,本来是可解释的也解释不清楚了,或者解释清楚了也听不清楚……大部分情况下,排序就两种结果:有用户行为的非新用户就是点什么推什么,无行为的新用户就是热门推荐。

就像行业里的头条、抖音、快手什么的,早期甚至现在都是你第一次打开就是美女、时效热点事件、当地特色内容等;然后你就一直看,算法就认为你喜欢,就一直找相似的推;然后你美味佳肴吃够了,偶尔也想来点粗粮,这时你就划掉那些美女了,或者自己搜索点什么,那算法就认为你喜欢上其他内容了,那就帮你找新的相似的内容。

但这些说的都是表面哈,我来讲点深度的。其实算法里有个概念叫特征,特征是什么呢?就是能表达这个商品或者内容好坏的东西,其实就像“白、富、美”就是表达一个女人的特征。那算法里一般用什么特征呢,比如内容类关键的就是点击量、点赞量、评论数、点击率、完播率、停留时长、好评率……然后这些特征呢,还有周期,比如7天点击量、3天点击量、1小时点击量等。好这样估计有些人能理解推荐一些了。

03 为了多样性而做的多样性不做,但基于人群、用户行为、时令节日、空间等变化的多样性要做

1. 什么是多样性

一般推荐结果的多样性就是,连续Top N个结果是不同的,不同的维度一般是类目维度。这个是通俗的定义,如果要科学定义的话,其实是通过基尼系数、熵等来衡量的。

这里再多说一些多样性,仅是类目维度的多样性还不够,有些场景下需要下分到二、三、四级类、甚至是词维度,同时还可以根据图片、价格、商家、品牌、属性、作者等等很多维度不同的多样性。那大家如何理解多样性的呢?这里就会根据不同的屁股、不同的认知来理解了,抽象地讲没有感觉,我举些例子,做为推荐产品经理遇到比较多的情况应该是:

1)老板觉得多样性不够

这里多吐槽一下,在互联网公司推崇扁平化、去官僚化的情况下,做为一个底层人员,仍然要面对很多层级的老板,而且这些老板们的想法还都不一样,想法不一样也就算了,关键是他们还不听一线人员的方案。一般打仗是在前线的人员,最清楚状况,最知道怎么打,且将在外,军令可有所不从,但你在互联网公司,你要敢不从,那你就等着走人吧。

那老板们都如何理解多样性呢,比如甲老板会说,这怎么每天都给我推差不多的内容,我们平台上不是有很多内容吗,我们那个主推的怎么没看见;乙老板会说,一样的内容推得太多了;丙老板会说我在其他平台上看到的内容,咱们这怎么没推呢……

2)业务觉得多样性不够

业务经常是说,怎么没有我们品类的内容呢,怎么都是那个品类的内容呢?

3)用户觉得多样性不够

很多用户是不愿意反馈的,一般也就反馈点什么推什么、看过买过还推。

2. 如何做多样性

前面虽然提到了什么叫多样性,但不够具体,所以,在如何做前,还是要定义清楚什么是多样性,做到什么样,大家能满意。这里先说那些不是多样性不够:

1)不区分场景的多样性不是多样性问题

老板们不分任何时候,都想要多样性,这里有一个经典的场景,比如某个用户此刻想买个冰箱,或者是想了解某个事件,这时你非要为了多样性,再给他推荐个洗衣机、电视,虽然都是家装三件套,但这个用户可能不是新装修呀,有可能就是想换个冰箱,或者是给家里人买、或者是放到租房的地方,反正他不缺电视。

那你说想买上衣的时候,推荐裤子可以吧,这个场景看似成立,但不是适合所有用户;那这种跨品类的,组合式的推荐什么时候成立呢,这个要根据每个用户的意图强弱,行为丰富度等来动态判断。比如用户就是逛,就是什么都点,那基本上,你的推荐就可以发散一些,否则,有明确意图的,你就要帮他收敛,快速帮他找到他想要的,可能是他有一个价格心理,或者是一个属性风格的心理。

2)行为与意图茅盾的不是多样性问题

什么意思呢?就是经常有些内部的人,他不是想看真的内容或者购买那个东西,而是没有目的地乱点、乱看,点着点着,自己也忘了都点过什么,然后算法基本会基于你最近的点击等行为进行推荐。且由于算法贪心的Point wise模式,推荐的内容确实会是相似的多,这样就会造成错觉,怎么给我推的内容都差不多?

这里的差不多,就是上面说的,算法会基于行为推荐类目相似、价格相似等的内容,但老板要看到的是不同价格段的都来点,或者其他想法,反正是有自己的想法。有时能代表用户,但更多时候是参杂着自己的意愿,以及平台的导向。

比如也会说咱们平台不是还有很多内容吗,这里其实你可以建议你的老板去内容库或者商品库里看全部内容,推荐算法不可能把全部分类都推出来,那和过去的货架式、陈列式没什么区别了。

我们继续说多样性如何做。做之前呢,要知道目标,做到什么标准算好,那这里基本上是需要定量和定性去衡量的,比如定量上要提升浏览深度、CTR、停留时长、不同品类的曝光占比等,不同业务可能不太一样,定性上是否明显的Badcase在减少等。

有了衡量标准后,就是具体策略了,这个策略也要从多层进行制定,基本上推荐要想优化一个问题,都是要全方面的调整,不可能有一个大招,就解决所有问题,那一般都是从数据、召回、排序、交互上去优化:

1)数据

数据这不多说了,核心是三点,数据要全面、准确、实时;你要搞清楚人的画像和商品内容的画像,要不然无法进行准确的召回和匹配。

2)召回

这里要多说一点,召回源是推荐最重要的部分,如果你只有一路相似召回,那你就没法做多样性。至少要按人群、时间、空间、场景等维度进行差异化的召回,比如新人召回热销、或者基于CF的召回;非新更多是基于用户行为的相似相关召回。

还有些人会深度将人群分得更细,比如阿里的八大人群。从时间上会基于平日、季节、节日、大促、热点、上新等进行召回;从空间上会基于LBS召回;场景上则会比较多,比如是用户动线购前、中、后等,用户需求的具体场景,比如办年货、吃火锅等。除了这些召回外,还有一些更偏算法的,比如KNN,KG,Base Model CF。

3)排序

这里和多样性相关的应该是模型由Point wise调整为List Wise,以及通过MMR等进行打散的排序,还可能加入一些硬规则的M出N的排序,然后EE和生态排序也可以算到这里。

4)交互

这里最重要的是,要实时捕捉用户的正负反馈,根据正反馈加强推荐,根据负反馈削弱推荐;同时要在产品交互形态上做到动态交互,既用户点击某个Item后回到列表页时,下一个如何进行动态的推荐;以及用户翻页时,要进行重新推荐,这里有些会使用端智能,但感觉端智能还是提升有限,最好还是进行服务端重新的推荐。

总结一下多样性的要点:

  • 用户意图非常明确收敛时,不要做大力度的多样性;
  • 用户意图发散时,要加强多样性;
  • 要合逻辑地做多样性,不要为了多样性而多样性;

个人观点的体感不做,但大多数人的用户体验,敏感商品屏蔽等要做;

拍脑袋的功能不做,但通过数据分析、行业调研、ROI高的要先AB实验做;

前端样式变来变去的策略产品不做,但分人群等个性化的UE及方案等要做;

天天干预配置的运营、策略产品不做,但要提供工具给产品运营用;

天天帮研发找表、跑数的保姆不做,但跨部门协调、数据分析等要做;

左手导右手的不做,但如果能形成全局效率最大化的要做;

人情类的需求不做,但为了生存有选择性地做。

以上为个人观点,不代表任何机构。

本文由 @元气 原创发布于人人都是产品经理,未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

给作者打赏,鼓励TA抓紧创作!

Recommend

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK