用Dropout思想做特征选择保证效果,还兼顾了线上性能?

AINLP 2022-04-11 10:10

The following article is from 炼丹笔记 Author 炼丹小生

一本有仙气的笔记，记录了AI的不凡。记录：推荐系统、搜索、计算广告、自然语言处理、机器学习、深度学习，偶尔还有一些工作上的碎碎念…

作者：炼丹小生这篇论文《Towards a Better Tradeoff between Effectiveness and Efficiency in Pre-Ranking: A Learnable Feature Selection based Approach》教会了我们如何做粗排模型兼顾模型的效率和效果.提出了可学习的特征选择方法FSCD,并在真实电商系统中应用.
640?wx_fmt=png

如上图(a)所示,受系统时延约束,推荐系统往往是多阶段的.再看图(b),论文提到简单的representation-focused(RF)模型会严重制约我们模型的表达能力(如传统双塔,最后一层向量Dot,就是简单RF模型),主要是缺少特征交叉.所以我们能否在特征上做优化,只保留效果好的特征又能保证模型推断效率更高,用上和精排一样interaction-focused(IF)的模型呢?当然是可以的!

粗排用上精排的模型并且要保持高效率,也就意味着在某些方面要做牺牲,那果断就是在特征上入手了,因此IF的粗排模型用上的特征是精排的子集.如上图所示,FSCD方法中效果是通过梯度优化,效率是通过特征维度的正则化来保证.在训练过程中就可以挖掘到一批有用的特征.

对于每个特征而言,都有个可学习的dropout参数Z𝑗 ∈ {0, 1} ,并且是符合伯努利分布:

640?wx_fmt=jpeg

该分布的超参是由特征复杂度cj决定的,cj是由特征的计算复杂度oj,向量维度ej,还有key的多少nj一起决定的.

640?wx_fmt=jpeg

最终损失函数如下所示:

640?wx_fmt=png

我们可以看到每个zj还会乘上正则化系数:

640?wx_fmt=jpeg

又因为zj的伯努利分布不可导,可以近似为:

640?wx_fmt=png

参考文献

1、Towards a Better Tradeoff between Effectiveness and Efficiency in Pre-Ranking: A Learnable Feature Selection based Approach

https://arxiv.org/pdf/2105.07706.pdf

2、https://zhuanlan.zhihu.com/p/375943741

AINLP

一个有趣有AI的自然语言处理公众号：关注AI、NLP、机器学习、推荐系统、计算广告等相关技术。公众号可直接对话双语聊天机器人，尝试自动对联、作诗机、藏头诗生成器，调戏夸夸机器人、彩虹屁生成器，使用中英翻译，查询相似词，测试NLP相关工具包。

343篇原创内容

Official Account

进技术交流群请添加AINLP小助手微信（id: ainlper)
请备注具体方向+所用到的相关技术点

关于AINLP

AINLP 是一个有趣有AI的自然语言处理社区，专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享，主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等，欢迎关注！加技术交流群请添加AINLPer(id：ainlper)，备注工作/研究方向+加群目的。

阅读至此了，分享、点赞、在看三选一吧🙏

用Dropout思想做特征选择保证效果,还兼顾了线上性能?

用Dropout思想做特征选择保证效果,还兼顾了线上性能?

Recommend

美国太空司令部确认第一个撞击地球的星际天体

How Russia's Invasion Triggered a US Crackdown on Its Hackers

俄罗斯造光刻机，这事儿靠谱吗？

Game while sleeping: Check out this motorized bed made for dedicated gamers | Te...

正则化由浅入深的进阶之路

PowerColor Radeon RX 6750XT Red Devil graphics card listing points to imminent R...

融资百亿的无人机，还在等待“起飞”

三次冲击IPO，柠萌影业在急什么?

handle secret with keybase

ETF日报 | 今日沪指收跌2.61%，18只股票类ETF上涨、最高上涨3.25%

About Joyk