一种基于稀疏自编码器的词元构造方法及系统

AITNT
正文
推荐专利
一种基于稀疏自编码器的词元构造方法及系统
申请号:CN202511171124
申请日期:2025-08-21
公开号:CN120725010B
公开日期:2025-12-30
类型:发明专利
摘要
本发明公开了一种基于稀疏自编码器的词元构造方法及系统,所述方法包括:获取物品的语义嵌入向量;采用权重共享策略,通过权重共享的码本计算码本向量与原始嵌入的相似度;对相似度执行top‑K稀疏化,保留相似度值最大的K个码本向量,其余置零,生成稀疏表征;根据稀疏表征中非零元素的位置及数值大小生成离散词元序列;通过解码器重建语义嵌入;联合重构损失、正交约束以及多样性正则化优化模型。本发明通过稀疏表示和正交约束优化,显著提升了物品表示的质量和推荐性能。本方法利用稀疏自编码器结合可训练的码本直接学习物品语义特征的稀疏表示,并通过正交约束确保码本向量的独立性和语义唯一性,从而有效缓解训练不平衡和嵌入坍塌问题。
技术关键词
编码器 元素 解码器 非暂态计算机可读存储介质 重构 构造系统 序列 策略 处理器 生成方式 推荐系统 数值 语义特征 模块 唯一性 存储器 标识符 矩阵
系统为您推荐了相关专利信息
1
监测设备状态的方法、装置和计算机可读存储介质
设备控制指令 异常状态 控制终端 故障诊断模型 重构模型
2
一种蛋白质序列磷酸化位点的预测方法、系统、计算机设备和存储介质
条件随机场 位点 编码氨基酸序列 注意力机制 滑动窗口
3
一种合照照片的人脸替换方法和系统
照片 卷积编码器 人脸替换方法 表情特征 编辑
4
模型动态遮挡检测与调整方法、系统、存储介质及设备
展示界面 三维模型 模型渲染技术 编辑 坐标
5
一种基于无人机遥感数据的互花米草信息提取方法及系统
无人机遥感数据 信息提取模型 信息提取方法 空间分布信息 多光谱
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号