KDD2021| 工业界搜推广nlp论文整理|电子爱好者

admin管理员组
文章数量:1633029

本文整理了KDD21的Accepted Papers[1]中，工业界在搜索、推荐、广告、nlp上的文章。整理的论文列表比较偏个人口味，选取的方式是根据论文作者列表上看是否是公司主导的，但判断比较偏主观，存在漏掉的可能。整理的方式主要按照公司和方向来划分，排名不计先后顺序。

1. 按照方向分类

主要挑选了一些笔者比较感兴趣的方向，并整理了对应的文章名称。读者可以大致读一下文章名，判断是否和自己的研究方向或工作方向一致，从中选择感兴趣的文章进行精读。

1.1 推荐系统

1.1.1 样本

涉及到采样、负样本等。

Google: Bootstrapping for Batch Active Sampling
Google: Bootstrapping Recommendations at Chrome Web Store
Alibaba：Real Negatives Matter: Continuous Training with Real Negatives for Delayed Feedback Modeling

1.1.2 表征学习

Google: Learning to Embed Categorical Features without Embedding Tables for Recommendation
华为：An Embedding Learning Framework for Numerical Features in CTR Prediction
腾讯：Learning Reliable User Representations from Volatile and Sparse Data to Accurately Predict Customer Lifetime Value
阿里：Representation Learning for Predicting Customer Orders

1.1.3 跨域推荐

阿里：Debiasing Learning based Cross-domain Recommendation
腾讯：Adversarial Feature Translation for Multi-domain Recommendation

1.1.4 纠偏

阿里：Contrastive Learning for Debiased Candidate Generation in Large-Scale Recommender Systems
阿里：Debiasing Learning based Cross-domain Recommendation

1.1.5 图神经网络

华为：Dual Graph enhanced Embedding Neural Network for CTR Prediction
美团：Signed Graph Neural Network with Latent Groups
阿里：DMBGN: Deep Multi-Behavior Graph Networks for Voucher Redemption Rate Prediction
百度：MugRep: A Multi-Task Hierarchical Graph Representation Learning Framework for Real Estate Appraisal

1.1.6 多任务学习

Google：Understanding and Improving Fairness-Accuracy Trade-offs in Multi-Task Learning
美团：Modeling the Sequential Dependence among Audience Multi-step Conversions with Multi-task Learning for Customer Acquisition
百度：MugRep: A Multi-Task Hierarchical Graph Representation Learning Framework for Real Estate Appraisal

1.1.7 多模态/短视频推荐

阿里：SEMI: A Sequential Multi-Modal Information Transfer Network for E-Commerce Micro-Video Recommendations

1.1.8 知识图谱

Microsoft：Reinforced Anchor Knowledge Graph Generation for News Recommendation Reasoning

1.1.9 推荐系统架构

Facebook：Training Recommender Systems at Scale: Communication-Efficient Model and Data Parallelism
Facebook：Hierarchical Training: Scaling Deep Recommendation Models on Large CPU Clusters
阿里，FleetRec: Large-Scale Recommendation Inference on Hybrid GPU-FPGA Clusters
腾讯，Large-Scale Network Embedding in Apache Spark
Microsoft，On Post-Selection Inference in A/B Testing

1.2 搜索

1.2.1 向量检索

阿里：Embedding-based Product Retrieval in Taobao Search

1.2.2 查询/内容理解

Facebook：Que2Search: Fast and Accurate Query and Document Understanding for Search at Facebook

1.2.3 概念图谱

阿里巴巴：AliCG: Fine-grained and Evolvable Conceptual Graph Construction for Semantic Search at Alibaba
阿里巴巴：AliCoCo2: Commonsense Knowledge Extraction, Representation and Application in E-commerce

1.2.4 预训练

百度：Pretrained Language Models for Web-scale Retrieval in Baidu Search
微软：Domain-Specific Pretraining for Vertical Search: Case Study on Biomedical Literature

1.2.5 Query改写/自动补全

微软：Diversity driven Query Rewriting in Search Advertising
百度：Meta-Learned Spatial-Temporal POI Auto-Completion for the Search Engine at Baidu Maps

1.2.6 图神经网络

百度：HGAMN: Heterogeneous Graph Attention Matching Network for Multilingual POI Retrieval at Baidu Maps

1.2.7 多模态

Google: Mondegreen: A Post-Processing Solution to Speech Recognition Error Correction for Voice Search Queries
Facebook：VisRel: Media Search at Scale

1.2.8 边缘计算

阿里：FIVES: Feature Interaction Via Edge Search for Large-Scale Tabular Data

1.2.9 搜索引擎架构

百度：Norm Adjusted Proximity Graph for Fast Inner Product Retrieval
百度：JIZHI: A Fast and Cost-Effective Model-As-A-Service System for Web-Scale Online Inference at Baidu

1.3 广告

这一块文章不是很多，就不细分了。

Google: Clustering for Private Interest-based Advertising
阿里：A Unified Solution to Constrained Bidding in Online Display Advertising
阿里：Exploration in Online Advertising Systems with Deep Uncertainty-Aware Learning
阿里：Neural Auction: End-to-End Learning of Auction Mechanisms for E-Commerce Advertising
阿里：We Know What You Want: An Advertising Strategy Recommender System for Online Advertising

1.4 NLP

1.4.1 预训练

微软：NAS-BERT: Task-Agnostic and Adaptive-Size BERT Compression with Neural Architecture Search
阿里：M6: Multi-Modality-to-Multi-Modality Multitask Mega-transformer for Unified Pretraining
微软：TUTA: Tree-based Transformers for Generally Structured Table Pre-training

1.4.2 命名实体识别

微软：Reinforced Iterative Knowledge Distillation for Cross-Lingual Named Entity Recognition

1.4.3 少样本学习

微软：Generalized Zero-Shot Extreme Multi-label Learning
微软：Zero-shot Multi-lingual Interrogative Question Generation for "People Also Ask" at Bing

1.4.4 摘要

微软：Reinforcing Pretrained Models for Generating Attractive Text Advertisements

1.4.5 意图识别

阿里：MeLL: Large-scale Extensible User Intent Classification for Dialogue Systems with Meta Lifelong Learning

1.4.6 多模态

阿里：M6: Multi-Modality-to-Multi-Modality Multitask Mega-transformer for Unified Pretraining

2.按照公司分类

2.1 Google

Learning to Embed Categorical Features without Embedding Tables for Recommendation
NewsEmbed: Modeling News through Pre-trained Document Representations
Understanding and Improving Fairness-Accuracy Trade-offs in Multi-Task Learning
Bootstrapping for Batch Active Sampling
Bootstrapping Recommendations at Chrome Web Store
Clustering for Private Interest-based Advertising
Dynamic Language Models for Continuously Evolving Content
Mondegreen: A Post-Processing Solution to Speech Recognition Error Correction for Voice Search Queries
On Training Sample Memorization: Lessons from Benchmarking Generative Modeling with a Large-scale Competition

2.2 Facebook

Training Recommender Systems at Scale: Communication-Efficient Model and Data Parallelism
Preference Amplification in Recommender Systems
Hierarchical Training: Scaling Deep Recommendation Models on Large CPU Clusters
Network Experimentation at Scale
Que2Search: Fast and Accurate Query and Document Understanding for Search at Facebook
VisRel: Media Search at Scale
Balancing Consistency and Disparity in Network Alignment

2.3 Microsoft

Generalized Zero-Shot Extreme Multi-label Learning
Learning Multiple Stock Trading Patterns with Temporal Routing Adaptor and Optimal Transport
NAS-BERT: Task-Agnostic and Adaptive-Size BERT Compression with Neural Architecture Search
Reinforced Anchor Knowledge Graph Generation for News Recommendation Reasoning
Table2Charts: Recommending Charts by Learning Shared Table Representations
TabularNet: A Neural Network Architecture for Understanding Semantic Structures of Tabular Data
TUTA: Tree-based Transformers for Generally Structured Table Pre-training
Contextual Bandit Applications in a Customer Support Bot
Diversity driven Query Rewriting in Search Advertising
Domain-Specific Pretraining for Vertical Search: Case Study on Biomedical Literature
On Post-Selection Inference in A/B Testing
Reinforced Iterative Knowledge Distillation for Cross-Lingual Named Entity Recognition
Reinforcing Pretrained Models for Generating Attractive Text Advertisements
Zero-shot Multi-lingual Interrogative Question Generation for "People Also Ask" at Bing

2.4 阿里

A Unified Solution to Constrained Bidding in Online Display Advertising
AliCG: Fine-grained and Evolvable Conceptual Graph Construction for Semantic Search at Alibaba
AliCoCo2: Commonsense Knowledge Extraction, Representation and Application in E-commerce
Contrastive Learning for Debiased Candidate Generation in Large-Scale Recommender Systems
Debiasing Learning based Cross-domain Recommendation
Device-Cloud Collaborative Learning for Recommendation
Deep Inclusion Relation-aware Network for User Response Prediction at Fliggy
DMBGN: Deep Multi-Behavior Graph Networks for Voucher Redemption Rate Prediction
Dual Attentive Sequential Learning for Cross-Domain Click-Through Rate Prediction
Embedding-based Product Retrieval in Taobao Search
Exploration in Online Advertising Systems with Deep Uncertainty-Aware Learning
FIVES: Feature Interaction Via Edge Search for Large-Scale Tabular Data
FleetRec: Large-Scale Recommendation Inference on Hybrid GPU-FPGA Clusters
Intention-aware Heterogeneous Graph Attention Networks for Fraud Transactions Detection
Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network Approach
M6: Multi-Modality-to-Multi-Modality Multitask Mega-transformer for Unified Pretraining
Markdowns in E-Commerce Fresh Retail: A Counterfactual Prediction and Multi-Period Optimization Approach
MeLL: Large-scale Extensible User Intent Classification for Dialogue Systems with Meta Lifelong Learning
Multi-Agent Cooperative Bidding Games for Multi-Objective Optimization in e-Commercial Sponsored Search
Neural Auction: End-to-End Learning of Auction Mechanisms for E-Commerce Advertising
Real Negatives Matter: Continuous Training with Real Negatives for Delayed Feedback Modeling
Representation Learning for Predicting Customer Orders
SEMI: A Sequential Multi-Modal Information Transfer Network for E-Commerce Micro-Video Recommendations
We Know What You Want: An Advertising Strategy Recommender System for Online Advertising

2.5 百度

Norm Adjusted Proximity Graph for Fast Inner Product Retrieval
Curriculum Meta-Learning for Next POI Recommendation
Pretrained Language Models for Web-scale Retrieval in Baidu Search
HGAMN: Heterogeneous Graph Attention Matching Network for Multilingual POI Retrieval at Baidu Maps
JIZHI: A Fast and Cost-Effective Model-As-A-Service System for Web-Scale Online Inference at Baidu
Meta-Learned Spatial-Temporal POI Auto-Completion for the Search Engine at Baidu Maps
MugRep: A Multi-Task Hierarchical Graph Representation Learning Framework for Real Estate Appraisal
SSML: Self-Supervised Meta-Learner for En Route Travel Time Estimation at Baidu Maps
Talent Demand Forecasting with Attentive Neural Sequential Model

2.6 腾讯

Why Attentions May Not Be Interpretable?
Adversarial Feature Translation for Multi-domain Recommendation
Large-Scale Network Embedding in Apache Spark
Learn to Expand Audience via Meta Hybrid Experts and Critics
Learning Reliable User Representations from Volatile and Sparse Data to Accurately Predict Customer Lifetime Value

2.7 美团

Modeling the Sequential Dependence among Audience Multi-step Conversions with Multi-task Learning for Customer Acquisition
User Consumption Intention Prediction in Meituan
Signed Graph Neural Network with Latent Groups
A Deep Learning Method for Route and Time Prediction in Food Delivery Service

2.8 华为

An Embedding Learning Framework for Numerical Features in CTR Prediction
Dual Graph enhanced Embedding Neural Network for CTR Prediction
Discrete-time Temporal Network Embedding via Implicit Hierarchical Learning
Retrieval & Interaction Machine for Tabular Data Prediction
A Multi-Graph Attributed Reinforcement Learning Based Optimization Algorithm for Large-scale Hybrid Flow Shop Scheduling Problem

结语

后续笔者会针对感兴趣的文章进行解读。如果大家有感兴趣的文章，也欢迎在公众号后台跟我留言，我会优先挑选大家感兴趣的文章进行解读。当然，如果你有解读好的笔记，也欢迎投稿或交流~~

一起交流

想和你一起学习进步！『NewBeeNLP』目前已经建立了多个不同方向交流群（机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等），名额有限，赶紧添加下方微信加入一起讨论交流吧！（注意一定要备注信息才能通过）

参考

[1] KDD2021 Accepted Papers: https://kdd/kdd2021/accepted-papers/index

[2] KDD2021 | 推荐系统论文集锦

- END -

基于表征(Representation)的文本匹配、信息检索、向量召回的方法总结

2021-07-12

聊一聊 “超大模型”

2021-07-11

对比学习还能这样用：字节推出真正的多到多翻译模型mRASP2

2021-07-09

小白必看：一文读懂推荐系统负采样

2021-07-09

本文标签：工业界论文 NLP

版权声明：本文标题：KDD2021| 工业界搜推广nlp论文整理内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dongtai/1729149206a1187900.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

KDD2021| 工业界搜推广nlp论文整理

1. 按照方向分类

1.1 推荐系统

1.1.1 样本

1.1.2 表征学习

1.1.3 跨域推荐

1.1.4 纠偏

1.1.5 图神经网络

1.1.6 多任务学习

1.1.7 多模态/短视频推荐

1.1.8 知识图谱

1.1.9 推荐系统架构

1.2 搜索

1.2.1 向量检索

1.2.2 查询/内容理解

1.2.3 概念图谱

1.2.4 预训练

1.2.5 Query改写/自动补全

1.2.6 图神经网络

1.2.7 多模态

1.2.8 边缘计算

1.2.9 搜索引擎架构

1.3 广告

1.4 NLP

1.4.1 预训练

1.4.2 命名实体识别

1.4.3 少样本学习

1.4.4 摘要

1.4.5 意图识别

1.4.6 多模态

2.按照公司分类

2.1 Google

2.2 Facebook

2.3 Microsoft

2.4 阿里

2.5 百度

2.6 腾讯

2.7 美团

2.8 华为

结语

一起交流

参考

更多相关文章

【论文阅读】Learning Distinctive Margin toward Active Domain Adaptation中categorical-wise margin loss的作用

主动领域自适应(Active Domain Adaptation)部分经典论文汇总

A Brief History of Word Embeddings and Their Use in NLP

计算机视觉论文-2021-07-28

image captioning经典论文分类整理+部分有源码

目标检测之RFB-NET（论文翻译辅助阅读）

CVPR2022论文列表（中英对照）

论文笔记-------Topological sound

论文速递 | Operations Research 6月文章合集

【论文翻译】UniT: Unified Knowledge Transfer for Any-Shot Object Detection and Segmentation

Transformer论文翻译

NLP系列经典论文(1)-- Attention Is All You Need

【NLP】让AI读懂法律文书：一种基于多分类的关键句识别方法

论文笔记：Multiple Object Tracking: A Literature Review

网络空间安全论文笔记3——缺陷

上海科技创新资源数据中心--免费下载知网、万方等平台论文

推荐系统论文笔记（1）:Hybrid Recommender Systems:Survey and Experiments

人工智能-ChatGPT-论文辅助

[论文阅读] (23)恶意代码作者溯源(去匿名化)经典论文阅读：二进制和源代码对比

NLP--ChatGPT的API参数总结【实践】

发表评论

推荐文章

鸿蒙HarmonyOS与Android开发选择哪个更合适？_android开发还是鸿蒙开发

Photoshop 2021 for mac(PS2021)

java jdk下载_jdk1.7下载|Java Development Kit (JDK) 下载「64位」-太平洋下载中心

【Java】快速接入ChatGPT API实现聊天、生成图像

一款windows与linux互传文件无障碍的软件(安装+操作步骤)

热门文章

中科院版chatgpt运行显示“代理所在地查询超时，代理可能无效”

pycharm代码格式化快捷键Ctrl+Alt+L失效解决方案

清除浏览器缓存的快捷键

windows下ctrl加斜杠组合键失效的原因和处理

ZOJ--Doki Doki Literature Club

Mac版Ps、AE、PR不能突然使用？

Vmware虚拟机下三种网络模式配置，桥接，NAT，主机模式

Chatgpt API 常见返回错误及解决方案

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载