基于双视图图对比学习和细粒度匹配的跨域会话推荐系统

谢江

当前位置：首页 > 科学研究与应用 > 基于双视图图对比学习和细粒度匹配的跨域会话推荐系统

科学研究与应用

Journal of Scientific Research and Applications

主办单位:
未來中國國際出版集團有限公司
ISSN:
3079-7071（P）
ISSN:
3080-0757（O）
期刊分类:
科学技术
出版周期:
月刊
投稿量:
5
浏览量:
585

基于双视图图对比学习和细粒度匹配的跨域会话推荐系统

Cross-Domain Session Recommendation System Based on Dual-View Graph Contrastive Learning and Fine-Grained Matching

发布时间：2026-03-31

作者: 谢江 :成都东软学院智能科学与工程学院四川成都;

摘要: 随着跨域推荐和基于会话的推荐系统在多种实际应用中的广泛应用，如何提升推荐系统在数据稀疏、用户兴趣变化快速的场景下的精度和鲁棒性，仍然是推荐系统领域中的一个重要挑战。现有的跨域推荐方法未能充分捕捉用户在短期的兴趣变化，而会话推荐方法通常忽视了跨域信息的融合，导致推荐精度受到限制。为了解决这一问题，本文提出了一种基于双视图图对比学习和细粒度匹配的跨域会话推荐系统框架(FM-DGCL)。我们通过构建不同视图的用户-项目图，使用图神经网络(GNN)从多个维度深入挖掘用户的行为模式，捕捉用户在不同领域中的兴趣变化。对比学习机制促使不同领域之间的知识共享。在此基础上，结合跨域学习得到的用户嵌入与会话中的项目交互图，在目标领域的会话推荐中精准捕捉用户的短期兴趣变化。通过细粒度的匹配策略，在每个视图中实现用户兴趣与项目特性之间的动态匹配，提升会话推荐的精确度。我们在多个公开数据集上进行了广泛的实验。实验结果表明，所提出方法能够有效解决数据稀疏问题，并且在捕捉用户多维兴趣和短期兴趣变化方面具有显著优势。

Abstract: With the widespread application of cross-domain recommendation and session-based recommendation systems in various practical scenarios, improving the accuracy and robustness of recommendation systems under conditions of data sparsity and rapidly shifting user interests remains a critical challenge in the field. Existing cross-domain recommendation methods often fail to adequately capture users' short-term interest dynamics, while session-based recommendation approaches typically overlook the integration of cross-domain information, thereby limiting recommendation performance. To address this issue, this paper proposes a cross-domain session-based recommendation framework (FM-DGCL) based on dual-view graph contrastive learning and fine-grained matching. By constructing user-item graphs from different perspectives, we employ graph neural networks (GNNs) to deeply mine user behavior patterns across multiple dimensions and capture shifts in user interests across different domains. A contrastive learning mechanism facilitates knowledge sharing between domains. Building on this, we integrate cross-domain user embeddings with session-specific item interaction graphs to accurately capture short-term interest variations in target-domain session recommendations. Through a fine-grained matching strategy, dynamic alignment between user interests and item characteristics is achieved within each view, thereby enhancing the precision of session recommendations. Extensive experiments on multiple public datasets demonstrate that the proposed method effectively alleviates data sparsity issues and exhibits notable advantages in capturing users' multi-dimensional interests and short-term interest dynamics.

关键词: 跨域推荐；基于会话的推荐；对比学习；细粒度匹配；图神经网络

Keywords: cross-domain recommendation; session-based recommendation; contrastive learning; fine-grained matching; graph neural networks

引言

推荐系统依托用户与项目交互辅助信息获取，但单一领域数据稀疏性限制其性能。跨域推荐利用源域丰富知识提升目标域效果，缓解了稀疏性问题，然现有方法多忽视目标域用户短期兴趣动态变化，难以适配近期兴趣迁移。会话推荐常用RNN或Transformer模型（如ConvS2S、BERT4Rec）捕捉短期偏好；跨域推荐领域亦有研究（如SITN）借原型对比学习实现兴趣迁移。但用户兴趣与项目特性具多维性，单一嵌入难刻画复杂匹配关系，且现有方法多过度关注当前兴趣、忽略长期兴趣演变，数据稀疏时易过拟合或鲁棒性下降。受实际应用启发，融合会话推荐可同时识别长短周期兴趣，提升推荐精准性。为此，本文提出面向跨域会话推荐的双视图图对比学习与细粒度匹配框架（FM-DGCL），含三大核心模块：DV-GNN构建跨域交互图并生成嵌入；CDCL通过对比学习优化融合嵌入；FGMN结合RNN捕捉短期兴趣动态以实现精准匹配；JOM整合多任务损失优化参数。本文贡献：设计DV-GNN挖掘跨域长期兴趣；提出FGMN捕捉短期兴趣变化，融合跨域与会话推荐；多公开数据集实验表明，FM-DGCL优于现有基线，亚马逊数据集上Precision@10和MRR@10分别提升18.68%和15.61%。

1 方法

在本节中，本文定义了跨域会话推荐(CDSR)任务，并提供了FM-DGCL框架的总体描述。然后，提出了FM-DGCL的三个重要组成部分，即，双视图图神经网络、跨域对比学习模块和细粒度匹配网络。最后，文章描述了最终的预测层。

1.1 问题定义

跨域会话推荐相关定义如下：用户集合，其中，每个用户含属性信息；互不重叠的源域项目集合，目标域项目集合，两类项目均含属性信息。用户的跨域历史交互序列按时间排序，该序列表示用户在源域和目标域中的历史点击、阅读或观看等行为；目标域当前会话序列，其中，代表用户u在时间步之前的次交互，表示用户当前会话中的短期兴趣。构建跨域交互图，含源域，其中，为源域交互边，目标域，其中，为目标域交互边。

跨域会话推荐的目标是，基于用户源域、目标域历史行为（长期兴趣）、目标域会话序列（短期兴趣）及交互图，预测用户在目标域的下一个可能感兴趣的项目：，生成一个目标域的推荐列表。

图1 双视图图对比学习和细粒度匹配(FM-DGCL)的总体框架

1.2 FM-DGCL框架概述

FM-DGCL框架结构如图1所示，分跨域知识共享与会话推荐优化两层。跨域层构建两域序列图，经GNN生成嵌入、非线性投影及对比学习，输出融合嵌入；会话层通过细粒度匹配生成序列嵌入，结合跨域表示预测，联合优化损失实现协同优化。

1.3 双视图图神经网络

图神经网络（GNN）在捕捉结构化信息和高阶项目关系方面表现出色。然而，大多数现有的跨域推荐方法仅在单一领域进行建模，忽略了源域和目标域之间的兴趣迁移。为了解决这一问题，本文构建了双视图图神经网络（DV-GNN），分别在源域和目标域建模用户的交互序列，并通过图神经网络学习用户和项目的嵌入表示。

1.3.1 用户序列图嵌入学习

在该部分，本文将目标域序列和源域序列分别转换为图结构数据，并采用用户序列图编码器来学习项目嵌入。

目标域序列图构建。设用户在目标域的行为序列为：，我们将其建模为一个无向图，其中，节点表示用户在目标域内交互过的所有项目；边表示用户在时间步的交互行为后，在时间步i的交互行为是，在该图的构造过程中，不同用户的行为序列可以通过项目节点关联，从而学习跨用户的协同信息，不同领域的项目可以通过用户节点关联，从而促进跨域兴趣迁移。然后，为序列中的每个项目生成一个维嵌入集合：；同理，用户在源域的行为序列为：，源域图，为每个项目生成一个维嵌入集合：。其中，和是可学习向量。

1.3.2 用户序列图编码器层

为学习序列图高阶结构，本文采用GGNN传递消息，其通过GRU建模项目关系、控制信息流，选择性聚合更新节点嵌入，项目的消息传递公式如下：

(1)

其中，是第层GNN计算的项目节点j的嵌入；是项目节点的邻居集合；表示邻接权重（基于归一化邻接矩阵）；是第层的可学习权重矩阵；是非线性激活函数（ReLU）。若将目标域序列图的邻接矩阵表示为，为了有效捕捉跨域图中的协同信息，采用图卷积网络（GCN）进行嵌入学习：

(2)

表示度矩阵，；表示第层的嵌入矩阵。这样，最终的消息传递公式为：

(3)

经过GGNN计算后，我们得到目标域序列图的最终嵌入：。同理，源域序列图的最终嵌入：。

非线性投影。GNN嵌入直接用于对比学习存在三问题：域嵌入分布不一致、高维相似度计算数值不稳定，且非线性投影可提升性能。本文借鉴SimCLR，对两域项目嵌入做非线性投影，映射至共享空间以增强跨域对比稳定性。

使用多层感知机（MLP）进行投影：

, (4)

(5)

其中，是一个多层感知机（MLP），用于映射嵌入到一个对比学习空间；是源域和目标域的投影矩阵；是偏置项。

1.4 跨域对比学习模块

GNN跨域推荐多依赖显式交互监督，忽视数据稀疏性与域表示不一致问题。FM-DGCL引入CDCL，以自监督优化跨域嵌入，促进知识迁移，提升泛化能力。

1.4.1 正负样本构建

为使跨域用户嵌入一致，正样本对定义为同一用户源/目标域嵌入：，负样本对为不同用户或无关项目嵌入：，采用随机选择其他用户目标域表示生成。每用户训练批次含1正样本+k个负样本。

1.4.2 跨域对比损失计算

在前面本文通过MLP已经得到的源域和目标域的非线性投影分别为：。因此，采用余弦相似度来计算正样本对之间的相似度，可以得到正样本对的相似度为：；负样本对的相似度为：。为了优化跨域嵌入的学习，采用InfoNCE损失函数：

(6)

其中，表示负样本集合；表示温度参数，用于控制相似度的缩放。该损失函数的优化目标是最大化同一用户在不同领域的表示相似度，最小化不同用户的跨域表示相似度。通过对比学习，得到优化后的嵌入表示：和。

1.4.3 源域和目标域的融合嵌入表示

在经过对比学习优化后，本文使用加权融合（Weighted Fusion）来平衡两个领域的信息：

(7)

其中，表示最终的融合嵌入；λ表示权重超参数，采用自注意力机制，根据用户的历史行为动态调整权重，假设目标域用户的历史交互次数为，源域的交互次数为，那么，。

1.5细粒度匹配网络

会话推荐中用户短期兴趣易变，传统跨域推荐忽视会话细粒度交互导致实时性差。本文引入细粒度匹配网络（FGMN），捕捉会话偏好以提升推荐精度。

1.5.1 会话序列嵌入学习

给定用户在目标域的会话序列：。采用循环神经网络（RNN）进行序列建模，以生成会话序列的隐藏状态：。其中，表示第个时间步的隐藏状态；表示上一时间步的隐藏状态。最终，得到会话的隐藏状态序列：。

1.5.2细粒度行为特征建模

除了项目嵌入，本文进一步引入细粒度行为特征，用于增强用户偏好的表示能力。

在每个时间步，用户的行为可以表示为：。其中，表示项目的行为特征；表示细粒度行为特征的维度。将项目嵌入和细粒度行为特征进行拼接：。然后，将其输入到RNN中，得到增强后的隐藏状态：。其中，是线性变换矩阵；是偏置项；是激活函数。最终，生成细粒度增强的会话序列嵌入：。

为了优化会话匹配机制，使用基于交叉熵的对比损失：

(8)

其中，表示用户在时间步实际选择的项目。

1.6预测层

FM-DGCL框架旨在结合跨域知识与会话短期兴趣实现个性化推荐，将CDCL融合嵌入与FGMN会话嵌入输入RNN预测层，经联合优化生成推荐列表。研究已经得到了两个关键的用户嵌入：跨域融合嵌入和会话增强嵌入。采用RNN整合长短兴趣：

(9)

其中，表示拼接长期和短期兴趣；表示最终的用户表示，包含长期和短期兴趣。在得到用户的最终表示之后，我们计算用户对候选项目集合的匹配的分。对于每个候选项目，计算相似度：

(10)

其中，表示注意力权重，衡量用户在不同时间步的兴趣：

(11)

这确保了最近的交互得到更高的权重。使用余弦相似度计算：

(12)

为了获得最终推荐概率，使用Softmax归一化：

(13)

最终，我们获得一个n-维候选项目概率分布，用于生成最终的推荐列表。会话预测损失用于优化用户对下一步交互项目的预测：

(14)

为了确保跨域学习、会话兴趣建模和预测任务能够协同优化，引入了联合损失函数。采用加权多任务学习：

(15)

其中，是超参数，用于平衡不同任务的权重。

2 实验

为验证 FM-DGCL的有效性，我们在多个公开数据集上进行实验，并与主流方法进行对比。同时通过消融实验和参数敏感性分析，全面评估模型的关键模块和超参数设置。

2.1 数据集

本文选取Amazon Reviews的Books、Digital_Music、Movies_and_TV数据集开展实验，利用其用户多域重叠特性。数据涵盖三领域用户交互，预处理含：正向反馈时序排序、剔除低交互（<10次）及重复交互、保留有效跨域用户。统计数据见表1。

为了提升模型的学习能力，本文采用序列切分策略生成训练样本。具体而言，对于每位用户的交互序列，按照交互时间构造多个训练子序列：。

表1 数据集中的源域到目标域对的统计数据（包括对中重叠用户数量，以及对中每个域的项目数和交互数）

Source → Target pair	Books → Movies		Movies → Music
# Overlapped-Users	9482		5465
Domain	Books	Movies	Movies	Music
# Items	184,965	41,503	38,091	53,355
# Interactions	632,678	421,204	310,672	268,628

2.2评估指标

本文采用基于排序的两种指标：Precision@N（P@N）与MRR@N（M@N），分别用于评估推荐准确性和相关项目的排序质量，遵循前人研究的设置。

2.3 基线

为了验证FM-DGCL的有效性，本文将其与以下几种经典方法以及最先进的方法进行对比：

SRGNN：基于图神经网络的会话推荐方法，旨在建模会话内的项目转移关系，捕捉项目之间的时序依赖。
GCE-GNN：通过全局图建模项目之间的协作关系，从而增强推荐性能，适用于捕捉跨项目的高阶关系。
DA-GCN：基于图神经网络的方法，使用双通道图卷积来建模跨域项目间的转移关系，捕捉不同领域项目之间的交互信息。
MGCL：采用多视图对比学习捕捉目标域和源域的项目特性，从源域和目标域的项目特性中学习共享表示，有效缓解数据稀疏问题。
TAGNN：引入目标感知的注意力机制，增强候选项目之间的关联性建模，进一步提高推荐精度。
S2-DHCN：结合会话超图和对比学习优化项目嵌入表示，提升模型对复杂项目间关系的理解能力。
Uni-CDR：该方法通过图神经网络和跨域对齐技术，旨在通过共享用户兴趣表示来实现源域和目标域之间的知识迁移，显著提高了跨域推荐的效果。
π-Net：一种基于RNN的模型，该模型设计了一个跨域传输单元，以在每个时间戳跨不同域提取和共享用户信息。

2.4 实现细节

本文对比了FM-DGCL与单域、跨域及混合基线模型。各模型超参数均参照原文并调优，嵌入维度统一为64，使用Adam优化器（学习率0.001，批量128）。图神经网络模型层数为2-3层，对比学习方法设定了合适的对比权重。

在FM-DGCL采用两层GNN图编码器，嵌入维度d=64。优化使用Adam（初始学习率0.001），训练50个epoch，每3个epoch学习率衰减为0.1倍。L2正则化系数设置为。跨域对比损失权重为，，，源域与目标域邻居数、均设置为5。

表2 FM-DGCL相对于基线的性能（%）比较

Method	Books → Movies				Movies → Music
Method	P@10	M@10	P@20	M@20	P@10	M@10	P@20	M@20
π-Net	6.65	3.11	7.15	3.31	4.96	2.55	5.94	2.82
SRGNN	15.89	6.20	22.14	6.67	5.28	2.68	7.36	2.82
GCE-GNN	13.15	7.98	7.75	5.31	5.42	2.87	7.94	2.91
Uni-CDR	9.78	5.24	10.06	5.32	6.12	4.76	7.36	4.82
DA-GCN	22.92	13.14	23.93	10.89	13.53	6.42	19.92	6.48
MGCL	23.65	13.54	26.30	16.70	13.94	6.12	17.59	6.93
TAGNN	27.08	15.24	29.67	13.36	13.02	6.12	18.66	7.88
S2-DHCN	20.23	10.67	25.46	10.96	15.45	7.45	18.14	7.42
FM-DGCL	32.14	17.62	34.23	18.42	17.72	7.95	22.37	8.40
Improvement	18.68%	15.61%	15.3%	10.29%	14.69%	6.71%	12.29%	6.59%
p-value	<0.001	<0.001	<0.001	<0.001	<0.001	<0.001	<0.001	<0.01

注：最佳结果以粗体显示，次佳结果以下划线显示。通过配对t检验，p-value均小于0.01，即所有改进均具有显著性。

2.5 整体性能

本研究通过系统对比实验表明，FM-DGCL在多个数据集上的推荐性能显著优于现有主流基线模型，跨域任务中优势尤其明显。具体实验结果与提升百分比如表2所示。实验分析得出以下结论：图神经网络（GNN）方法（如GCE-GNN、DA-GCN）普遍优于传统RNN/CNN方法（如π-Net），表明GNN在建模项目高阶关系及跨域迁移方面具有优势；对比学习方法（如MGCL、S2-DHCN）通过实例级与集群级对比任务有效缓解数据稀疏并提升泛化；TAGNN虽在Books→Movies上表现突出，但其跨域泛化能力有限。FM-DGCL在Books→Movies数据集上P@10和M@10较最佳基线分别提升18.68%和15.61%，在Movies→Music数据集上P@10提升14.69%和6.71%。该性能提升源于跨域对比学习的知识迁移、细粒度匹配网络对短期兴趣演化的精准捕捉，以及多层次特征融合带来的领域适应性增强。统计显著性检验（p<0.01）进一步证实了结果的可靠性。

2.6 消融实验

为验证FM-DGCL各模块的贡献，本文设计消融实验，通过依次移除关键组件以分析其影响。完整模型记为Base；去除GNN图编码器为Base-GNN；去除跨域对比学习模块为Base-CL；去除细粒度匹配网络为Base-FM；去除联合优化模块为Base-J。实验结果如图2显示，Base-GNN性能下降表明GNN编码器在建模项目间高阶关系及用户行为图结构方面优于传统序列编码器，具有关键作用。Base-CL的性能下降突显了跨域对比学习模块通过融合源域与目标域用户偏好、缓解数据稀疏性、支持知识迁移的重要性。Base-FM性能显著降低，验证了细粒度匹配网络在捕捉用户短期兴趣与动态行为模式中的必要性，其能够将会话中的即时需求融入跨域推荐，提升准确性。Base-J的性能降低说明联合优化模块在多任务（如跨域对比学习与短期兴趣建模）间的信息共享与协同优化中具有积极作用，其缺失会削弱多任务学习能力。

图2 移除不同模块的FM-DGCL

3结论和未来工作

本文提出一种基于双视图图对比学习与细粒度匹配的跨域会话推荐框架（FM-DGCL）。该框架融合跨域推荐与会话推荐，通过双视图图对比学习实现跨域知识迁移与短期兴趣建模。采用基于时间卷积与注意力机制的细粒度匹配网络，捕捉用户短期兴趣演化，并借助多层次特征融合策略平衡用户长期偏好与短期兴趣，从而提升推荐精准性。实验表明，FM-DGCL在多个数据集上优于现有基线方法，验证了跨域与会话推荐协同优化的有效性。未来工作将进一步探索多模态学习，以融合跨域数据，增强用户偏好建模。

参考文献：

[1] 沈学利, 王嘉慧. 基于知识图谱的用户兴趣推荐[J].计算机系统应用,2025,34(04):155-165.
[2] 陈晋鹏, 李海洋, 张帆, 等. 基于会话的推荐方法综述[J]. 中文信息学报,2023,37(03):1-17+26.
[3] Buffelli D, Vandin F. The impact of global structural information in graph neural networks applications[J]. Data,2022,7(01):10.
[4] Chen T, Kornblith S, Norouzi M, et al. A simple framework for contrastive learning of visual representations[C]//International conference on machine learning.2020.
[5] 胡俊睿, 邹海涛, 郑尚, 等. 基于传播特征的微博流行度预测算法研究[J].计算机与数字工程,2023,51(04):763-768+964.
[6] 郭媛媛. 基于深度学习的音乐推荐系统研究与实现[D]. 东南大学,2023.
[7] Wu S, Tang Y, Zhu Y, et al. Session-based recommendation with graph neural networks[C]//Proceedings of the AAAI conference on artificial intelligence.2019,33(01):346-353.
[8] Wang Z, Wei W, Cong G, et al. Global context enhanced graph neural networks for session-based recommendation[C]//Proceedings of the43rd international ACM SIGIR conference on research and development in information retrieval.2020.
[9] Guo L, Tang L, Chen T, et al. DA-GCN: A domain-aware attentive graph convolution network for shared-account cross-domain sequential recommendation[J]. Proceedings of the thirtieth international joint conference on artificial intelligence.2021.
[10] Xu Z, Pan W, Ming Z. A multi-view graph contrastive learning framework for cross-domain sequential recommendation[C]//Proceedings of the17th ACM conference on recommender systems.2023.
[11] Yu F, Zhu Y, Liu Q, et al. TAGNN: Target attentive graph neural networks for session-based recommendation[C]//Proceedings of the43rd international ACM SIGIR conference on research and development in information retrieval.2020.
[12] Xia X, Yin H, Yu J, et al. Self-supervised hypergraph convolutional networks for session-based recommendation[C]//Proceedings of the AAAI conference on artificial intelligence.2021.
[13] Cao J, Li S, Yu B, et al. Towards universal cross-domain recommendation[C]//Proceedings of the sixteenth ACM international conference on Web search and data mining.2023.
[14] Ma M, Ren P, Lin Y, et al. π-net: A parallel information-sharing network for shared-account cross-domain sequential recommendations[C]//Proceedings of the42nd international ACM SIGIR conference on research and development in information retrieval.2019.

科学研究与应用

Journal of Scientific Research and Applications

相关文章

基于双视图图对比学习和细粒度匹配的跨域会话推荐系统

Cross-Domain Session Recommendation System Based on Dual-View Graph Contrastive Learning and Fine-Grained Matching

引言

1 方法

1.1 问题定义

1.2 FM-DGCL框架概述

1.3 双视图图神经网络

1.3.1 用户序列图嵌入学习

1.3.2 用户序列图编码器层

1.4 跨域对比学习模块

1.4.1 正负样本构建

1.4.2 跨域对比损失计算

1.4.3 源域和目标域的融合嵌入表示

1.5细粒度匹配网络

1.5.1 会话序列嵌入学习

1.5.2细粒度行为特征建模

1.6预测层

2 实验

2.1 数据集

2.2评估指标

2.3 基线

2.4 实现细节

2.5 整体性能

2.6 消融实验

3结论和未来工作

参考文献：