【超长序列建模】万级别:SIM《Search

编程入门 行业动态 更新时间:2024-10-10 11:22:13

【超长序列<a href=https://www.elefans.com/category/jswz/34/1769748.html style=建模】万级别:SIM《Search"/>

【超长序列建模】万级别:SIM《Search

万级别:SIM《Search-based User Interest Modeling with Lifelong Sequential Behavior Data for Click-Through Rate Prediction》

到了万级别,序列行为可能考虑的事情就不再是提取用户兴趣了,而是“过滤对于当前预估的噪声”。

MIMN 虽然通过计算分离的方式确保了时延方面无压力,但也带来了更新频率不一致,行为序列无法与候选 AD 更好的交互等问题。线上使用时,作者发现当序列长度超过 1k 时,MIMN 效果会变差(也是因为无法与候选 AD 交互)。

这个时候干脆模仿起推荐系统的召回、精排方法,对序列特征再做一次“召回”和“精排”:第一阶段Genral Search Unit(GSU)通过相对粗略的搜索模式,提取行为序列中与候选 AD 较相关的节点,第二阶段Exact Search Unit(ESU)通过精准搜索的模式,得到序列与候选 AD 的关系,并形成 embedding 供 MLP 使用。这个模型能吃下的最大序列长度为 54000,能满足工业界提取长期用户兴趣的需求。

这种召回+精排的思想之前也在AlphaCode见过一次了。

GSU

两种方案:hard-search 和 soft-search。给定用户行为 B = [ b 1 ; b 2 ; ⋯   ; b T ] \mathbf{B}=\left[\mathbf{b}_{1} ; \mathbf{b}_{2} ; \cdots ; \mathbf{b}_{T}\right] B=[b1​;b2​;⋯;bT​],GSU给每一个用户行为计算一个相关性分数 r i r_i ri​,然后根据 r i r_i ri​ 从B中选出Top-K相关行为:
r i = { Sign ⁡

更多推荐

【超长序列建模】万级别:SIM《Search

本文发布于:2024-03-23 19:16:16,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1741815.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:建模   序列   级别   Search   SIM

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!