算法能理解人类的品位么？

算法能理解人类的品位么？-鸟哥笔记

首页 > 数据运营 > 算法能理解人类的品位么？

算法能理解人类的品位么？

古牧聊数据

2022-12-07 14:46:18

国庆期间的一次出游，让我对推荐策略领域的一个问题产生好奇，苦苦思索却不得解之后，只能求助于一位资深&优秀的推荐策略产品经理（他还特意为此开通了公众号沉淀这些内容?），于是就有了今天这篇问答

哦，那个让我好奇的问题是——推荐算法，到底能不能理解我们人类的品味？！

马丁我跟你讲，我国庆去武夷山玩儿，差点就被小红书的推荐策略摆了一道！我去之前特意搜索并收藏了一些看起来不错的游记，但到了当地之后，你猜怎么着，幸亏我没去！

咋了？我没空跟你说相声，快说快说

嘿，就是有一个景点本来我计划最后一天去，但前两天在当地打车的好几个司机，听说我打算去那个什么小红书网红小众景点之后，都纷纷劝我不要去。人家原话是：

“这个景点啊，其实没有武夷山主景区的那个天游峰好看，差挺大的。主要就是因为不在景区里面，免费，所以好多穷游的人去打卡然后各种找角度拍，没想到就网红了？我们当地人是肯定不会去那里的”

我一边庆幸，一边职业病犯了，我就想：小红书推荐给我的那些笔记，真的互动数据都挺好的，说明真的是很多人喜欢看的，而且评论也没看到有翻车的迹象，但我真的就是不喜欢这种网红穷游小众打卡景点。是不是推荐算法没有办法很好的理解我的口味，或者说是品味

这跟品味有啥关系？我感觉就是内容标签没有打细致啊？或者推荐还缺乏数据，对你不了解给你推了[穷游]这种标签的内容罢了～别动不动就扯什么品味啦

不是，你听我说。可能这个例子不够好，确实能用[免费]或者[穷游]这种标签把这类内容过滤掉、不再推给我就好了。但图书呢？比如我喜欢看历史，喜欢明朝历史，但更多人喜闻乐见的可能就是《明朝那些事儿》，但我看了不喜欢，我更喜欢《南明史》这种调调的。它们从内容标签来看，很难再区分细化了吧？我觉得针对同类的内容，总会有些信息是难以被标签化的，这些就是人的口味、品味了

好吧，虽然你从第一个case切换了第二个case，而且两个case都有漏洞，但我依然理解你的意思了。我先武断的给你一个回答，然后再说说为啥哈～

算法其实能理解人的品味，但在你说的这种涉及商业价值的toC场景，犯不上、没必要～

嚯～那你得给我好好掰扯掰扯了，从原理到应用，正好也让我这个曾经的半吊子推荐策略产品经理精进一下

行，咱们从跟你问题相关的基础知识开始，温故知新。先说召回，再说排序

召回重点说这么3个：

【基于用户人群属性召回】

举个例子：你是#广东，#30岁，#男性，#月收入30000，#大学学历等等。那么我找到跟你一样标签的人群，将这个人群所喜欢的内容，挑出TOP500

不过在实践中往往会遇到一系列问题：

1. 标签识别率：并不是所有平台都具备足够多的用户画像

2. 阶级论失效：#月入80000，#博士学历，喜欢《斗破苍穹》；#月入5000，#高中学历，喜欢《瓦尔登湖》

3. 众口难调：这路召回的结果，如果基于较大人群中，那么基本都是热门流行品，推了也不会错的那种。如果向下细分，那么扰动偏差就会越来越大

【基于用户行为偏好召回】

举个例子：根据你经常看的内容，给你打上相应的内容兴趣标签和权重，例如#高消费0.82，#小众0.71，#ins风0.31等等。然后根据你的内容偏好给你召回相应的内容候选集

这种方案的依赖主要在3点：

1. 依赖内容标签的细化：例如游记类，如果有更细的高消费，小众，自驾等标签，那么品味某种程度上就是这里面一些标签的集合

2. 依赖创作者生态：只有标签细化，没有相应的供应量也没用。细分出ins风，结果整个平台只有300篇ins风游记这就挺尴尬

3. 依赖内容消费生态：定了细化标签，硬推了一波内容供给，结果用户行为数量稀疏，这就是尴尬中的尴尬

【物以类聚、人以群分】

举个例子：例如我喜欢《武夷山３天５夜游，带你复刻武陵捕鱼人的感受》等若干篇文章，冠希、彦祖、于彦也喜欢这些文章，那么我和“冠希、彦祖、于彦”从行为角度就是相似的，哪怕我们除了颜值以外一点相似的地方都没有。——这就是人以群分

再举个例子：冠希，彦祖，于彦，Martin等一批用户，都同时喜欢《武夷山３天５夜游》和《国内Ins风打卡速刷攻略》，那么这两篇内容就是相似的，哪怕他们一个重复的标签都没有。——这就是物以类聚

协同过滤利用的就是群体智慧，基于大量用户的行为来判定人与物品之间的匹配性，从而使得他可以超脱前述的结构要素本身，做到求其意而忘其形。这个点是最接近于你要求的识别品味的

不过这个策略也有他的瓶颈：

1. 要利用群体智慧，得先有群体数据。所以行为数据极少的情况下不好用——系统冷启动

2. 新物品刚上架，根本没人点，算来算去都和别的物品不相似，推荐不出去。但推荐不出去又更加没人点，从而陷入循环——物品冷启动

3. 你要让我人以群分，你先点一些东西，让我了解一下你啊，不然我怎么知道是彦祖和你相似还是潘长江和你相似——用户冷启动

等等啊，我得捋一捋。我印象中，召回就是系统用各种策略，快速地从整个内容库/商品库中寻找我较大概率感兴趣的东西，作为候选集。你刚说的那些，应该是挑了一些跟理解品味相关性比较高的内容说的吧，不是所有哈？

对，跟你说那么多太费劲～我接着说排序哈，召回已经前置准备好一个候选集了，可能数量级是1000个。可是我一个屏幕只能展示6个商品/内容，这1000个里面谁在前面谁在后面呢？这就是排序环节所决定的了。排序环节一般是通过大量数据训练出一个AI模型，然后由这个模型对候选集进行兴趣度排序

还是分成几个核心零部件来说

【特征工程】

特征可以理解为模型的输入信息，即y=ax+b中的x，也就是用户做决策时是什么状态。而y就是用户最后做了什么决策，而a和b就是所谓的模型参数，是算法根据海量x和y（样本数据）学出来的

举一个最简单的模型例子：用户购买商品的可能性（y）=3(a)*对商品类目的兴趣度(X1)+9(b)*对商品SKU的兴趣度(X2)

这样当用户来请求推荐结果的时候，发现X1：商品类目兴趣=0.72，X2：SKU兴趣=0.31，那么y:用户喜欢这个商品的概率就出来了

所以对于X，即特征的描绘就非常重要，他影响到模型的训练，也自然影响到推荐结果的准确性。而要理解品味，至少要保证以下几类决策时的信息被正确描述：

1. 我满意程度如何：最基本的满意是我点了，但这还不足够。加入完读、时长、互动、收藏、加购等更深交互深度的行为去刻画用户的满意。

2. 我是什么样的人：例如我的消费水平、我的职业身份、我的性别等等，即所谓的人口画像

3. 我的喜好是什么：我对XX类目、XX品牌、XX价格带的喜好程度如何

【排序模型】

排序层面更多的策略集中在样本划分/采样，结构设计，甚至一些超参数的玄学炼丹方法中，我们常人很难理解。但一个比较合理的猜测是，更高级的深度模型，会比简单的线性模型在“洞察品味“方面做得更好。因为高级模型能够学习到更细节的信息，特别是只能意会不能言传的品味

除此以外，我们能做另一个方面是“指标牵引”，本身模型就是一个黑盒子，就像是原神的卡池一样，谁也不知道里面藏了几个琴团长。我们只能通过一些指标来约束他的成长方向

比如，我们猜测提升“洞察品味”能力后，用户的留存率会上升。那么我们就以留存率作为模型本次升级的优化目标。不过在这里我们要注意两个方面：

1. 牵引指标错误。新手常犯的错误是，只看技术指标，例如CTR。尽管事实上模型很难以留存率为学习目标，但我们仍然要以这些指标来进行观测。因为CTR涨不代表好，他可能是标题党骗用户点击进去，但实际上留存是下降的

2. AB实验效果评价。实验参数正确选择只是一个前提，更重要的是正确评估策略的效用：你的实验效果是策略本身带来的，还是大环境带来的，你的实验对局部是正收益，对全局是否仍产生额外的正收益（还是只是从隔壁类目抢来了一些流量？）

（疯狂记笔记ing）哦哦好的，我温故了，现在说说重点吧，为啥你说我提的这个badcase没必要、犯不上？

先说说这个没必要，从【类目价值】和【影响程度】两方面展开讲

【类目价值】

存在推荐品味偏差的问题的是哪些品类？大类目的美妆测评没问题，小类目的游记出现问题了？游记类占总体内容的比例是多少，游记类的消费诉求有多少？游记类的商业价值（比如广告收入）如何？

这一通分析下来，游记类占比小，用户频率低（一年N次），那不好意思，这个需求排不上。但是美妆类目要是发现了这个问题，那就是P0级别的问题，必须当场修复

【影响程度】

多少用户像这个case一样会感受到品味的问题，他们的占比是多少？解决不了品味问题，多大程度会带来用户的留存下跌或其他负面影响？

不好意思，这个影响程度可能暂时就是眉头一皱，甚至大多数人没有感觉。好~这个需求又排不上

行吧，没必要这个我认了，那犯不上呢？有啥区别？

还是有细微差异的哈哈，犯不上指的是“能做，但大概率很难做好”。这个点从【垂类内容瓶颈】、【垂类数据瓶颈】、【用户表达陷阱】3个角度展开好了

【垂类内容瓶颈】

深入分析了一下游记类目，发现优质、高消费、小众这些标签细化后，细分类的内容供应不足。在内容不足的情况下，算法再精准也是巧妇难为无米之炊。如果需要解决，必须推动相应的内容创作激励计划，或者进行针对性UP主引入，扩大相应内容量级

需求转到内容生态团队，他们又问——推动对应类目的内容生产，价值在哪里？哈哈再次回到老路子

【垂类数据瓶颈】

这个垂类的人群是否具备一定基数？行为数据量是否充足？

事实上在通用型平台上，都会面临这个问题，即长尾兴趣类目受限用户对平台的认知，他的人群天然是狭窄的。即使具备一定基数的人群，他的互动频率天然也是低于正常值域的。当垂类兴趣数据不充分的情况下，算法自然对垂类的品味识别偏差度较高

一般来说，在垂类平台上，他的用户天生就是基于垂类聚集的，他的垂类数据也会足够充分，能够支持算法在更细致程度的用户理解和推荐

【用户表达陷阱】

就以新闻为例，我是希望给我推送的都是俄乌新闻，中美贸易这种时政大事，但是当他给我推荐特朗普宣布参与竞选，我还是忍不住点进去关心一下懂王的近况

很多时候理智和行为是两回事，间歇性踌躇满志，持续性混吃等死才是大多数用户的真实面目（我也是）

在这种情况下，再怎么叠加策略也没用，我就是真实、发至内心地关心懂王的生活啊。但是系统给我推荐的时候我还是会眉头一皱，表示拉低了我的格调

我感觉你不仅仅给我说了这个原理，还把推荐策略产品经理不得不面对的实际工作情况也给说了哈哈，是不是还夹杂着你的小无奈？～

嗨～万物皆可推荐，习惯了就好，有些场景其实还挺有意思的，我打算以后有空也自己总结总结

哦？比如呢？

比如社交婚恋的推荐吧，给男生推荐女生、给女生推荐男生，市面上这类app挺多，各有千秋，但大家需要知道到底哪家的推荐原理更适合自己。以及，还有一种重要的推荐场景——中介人推荐（类似房屋中介和保险代理人给你推荐对应信息），这个也是经常被忽略的，其实也很有意思，而且往往可能更靠谱

嘿，听着就带劲儿～你总结完了我哪儿能看啊，你发我啊记得！～

你关注这个公众号就好～除了搜索推荐策略，对AI应用/技术原理、toB商业化、传统企业数字化转型这几个话题，我都有不少干货想总结下?

好嘞～你可算是想通了、开始沉淀输出了，一键三连走起～

自打跟马丁对话后，我就一直催他再给我讲讲别的推荐场景，尤其是一些科普层面以外的、只有身处一线的资深从业者才有的感悟。他表示会再接再厉、长期耕耘下去，尤其是在这个行业寒冬期，坚持做好自己

最后引用马丁的公众号简介做今天的结尾：

“希望我创作的这些文章，像沿路掉下的面包屑一样，能够在未来帮助我找回旧日的自己。虽然——童话里的孩子们已经验证了，这是一个失败的方法，哈哈哈～”

本文系作者：古牧聊数据授权发表，鸟哥笔记平台仅提供信息存储空间服务。

本文为作者独立观点，不代表鸟哥笔记立场，未经允许不得转载。

《鸟哥笔记版权及免责申明》如对文章、图片、字体等版权有疑问，请点击反馈举报

Recommend

欧米茄的腕上绿意-品玩

Deals: Apple's M1 and M2 MacBook Air Available for All-Time Low Prices and Holid...

Understanding the UX Research Process

How to Regulate Ads on Google Chrome

T-Mobile 5G Home Internet awarded highest customer sat across all Internet optio...

CTO给CIO的新年建议

Report: Apple Starts Work on 20-Inch Foldable Display, Possibly for Future MacBo...

$454 off M1 Max MacBook Pro 32GB RAM | $70 off AppleCare

New communities in Microsoft Teams service takes on Facebook and Discord

Jacob & Co Astronomia Automatic AT130.40.AC.SD.A

About Joyk