DDST数据驱动软件技术实验室Data Driven Software Technology

我实验室成果荣获ICDE 2023唯一最佳论文奖
2023年5月17日

      近日,数据库领域三大顶会之一的ICDE 2023(IEEE International Conference on Data Engineering,CCF-A类会议)在美国加利福尼亚州阿纳海姆市召开,我实验室成员凭借多兴趣序列推荐的增量学习研究获得了本次大会唯一的最佳论文奖




      获奖的论文题目为“Incremental Learning for Multi-Interest Sequential Recommendation”(面向多兴趣序列推荐的增量学习),该论文提出了一套面向多兴趣序列推荐模型的增量学习框架,既能保留从历史交互序列中挖掘的用户既有兴趣,也能从新增交互序列中检测用户的新兴趣,实现对用户兴趣的自适应更新和动态扩展,在多兴趣序列推荐任务中取得了先进的性能。




      多兴趣序列推荐(MSR,Multi-interest Sequential Recommendation)通过分析用户与物品的交互序列,挖掘用户的多个潜在兴趣,并利用用户的多个兴趣进行物品推荐。该技术凭借其优秀的推荐性能获得了学界和业界的广泛关注。实际的推荐系统会不断采集用户最新的交互序列,在这个过程中用户的既有兴趣可能会发生偏移,同时也会有新的兴趣产生,如何利用最新的交互数据去更新多兴趣序列推荐模型是重要的研究课题。目前广泛采用的模型更新方法主要包括完全再训练和增量学习两类。前者可以捕获用户历史交互序列中包含的所有兴趣,但会产生高昂的训练成本。后者仅利用增量数据对模型进行微调,尽管训练时间和内存代价较小,但容易遗忘历史交互数据中出现的既有兴趣,也无法动态扩展模型以刻画用户的新兴趣,效果具有局限性。为此,需要提出一种面向多兴趣序列推荐系统的增量学习框架,兼具保留用户既有兴趣和动态捕捉用户新兴趣的能力。




多兴趣序列推荐模型的增量学习问题



      本论文提出了一种面向多兴趣序列推荐模型的增量学习框架IMSR,既能对用户的既有兴趣进行适当微调,也能动态扩展模型以刻画用户的新兴趣。IMSR框架包含三个重要组件:既有兴趣保留器、新兴趣检测器、兴趣修剪器。既有兴趣保留器旨在确保既有兴趣的表征在模型增量学习的过程中不会远离其原始位置。论文采用知识蒸馏的思想,根据既有兴趣和新交互序列计算蒸馏损失函数,以此制约既有兴趣的改变。新兴趣检测器负责根据最新交互的物品与既有兴趣的相关性来判断用户是否产生了新兴趣,并在新兴趣被检测出来后,及时对模型进行扩展以捕捉新兴趣。兴趣修剪器则采用兴趣表征空间投影的方式修剪琐碎的新兴趣,删除冗余兴趣,最终确定新兴趣的数量。通过上述组件,IMSR不仅保留了用户的既有兴趣,还能动态自适应地为每个用户创建从新交互序列演变而来的新兴趣。在多个多兴趣序列推荐数据集上的实验结果表明相较于目前先进的增量学习方法,IMSR训练得到的模型取得了更优的推荐性能。




IMSR增量学习框架示意图


      论文的第一作者王智恺为上海交通大学电子信息与电气工程学院计算机科学与工程系四年级博士生,主要研究方向为面向推荐系统的动态自适应学习。目前在IJCAI、ICDE等国际顶级会议上发表了若干篇学术论文。本科毕业于上海交通大学,曾获声申奖学金。

      论文的通讯作者沈艳艳为上海交通大学电子信息与电气工程学院计算机科学与工程系长聘副教授。主要研究领域包括大数据分析与处理、机器学习、数据挖掘等。目前发表领域内高水平学术论文90余篇,曾获VLDB 2022最佳研究论文奖、DASFAA 2020最佳论文提名奖、APWeb-WAIM 2018最佳学生论文奖。担任数据库领域国际顶级期刊TKDE副主编、顶会VLDB 2023-2024副主编。


    IEEE International Conference on Data Engineering (ICDE)是电气与电子工程师协会(IEEE)举办的旗舰会议,与SIGMOD、VLDB并称数据库领域三大国际顶级学术会议,入选为中国计算机学会推荐的A类国际学术会议,在国际上享有盛誉并具有广泛的学术影响力。






DDST

数据驱动软件技术实验室

地址:上海市闵行区东川路800号上海交通大学电信群楼东313
Email: ddst@sjtu.edu.cn