一种基于高斯离散嵌入的单词语义表示方法

AITNT
正文
推荐专利
一种基于高斯离散嵌入的单词语义表示方法
申请号:CN202510586478
申请日期:2025-05-08
公开号:CN120542426A
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开了一种基于高斯离散嵌入模型的单词语义表示方法,包括以下步骤:S1、高斯分布扩展词嵌入;使用变分自编码器(VAE)生成单词的词嵌入;S2、将S1步骤中生成的连续词嵌入映射到离散嵌入集合;使用向量量化技术,通过最近邻搜索算法选择最接近的离散词向量;S3、基于S2步骤生成的离散词嵌入与S1步骤中的连续词嵌入进行残差连接和归一化处理;S4、将S3步骤得到的归一化词向量输入到下游任务中;S5、计算并优化模型的总损失函数;所述损失函数包括VAE的重构损失、量化损失和任务特定损失。通过上述步骤,本发明实现了对单词语义的多层次表示,提升了自然语言处理任务的性能,尤其在处理多义词时具有显著优势。
技术关键词
语义 机器翻译 编码器 重构 多义词 计算误差 搜索算法 命名实体识别 自然语言 查找算法 文本 多层次 索引 参数 表达式 变量 噪声 模块
系统为您推荐了相关专利信息
1
一种图像数据扩充方法及系统
数据扩充方法 卷积神经网络框架 特征金字塔 多尺度结构 图像处理
2
面向抽象文本的生成式视频检索方法、装置、设备及介质
文本 视频检索方法 计算机视觉交叉 视频搜索 视频检索装置
3
利用上下文感知与地理文库增强地名地址翻译精度的方法
编码向量 语义 文本 条目 单体
4
一种基于边缘计算的数据运维管理方法和系统
数据运维管理方法 监督学习模型 实时数据 数据类型信息 终端设备
5
任务双向匹配方法、装置、设备及存储介质
语义向量 文本 非暂态计算机可读存储介质 编码 展示页面
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号