一种环保领域文本词向量化方法及相关系统

AITNT
正文
推荐专利
一种环保领域文本词向量化方法及相关系统
申请号:CN202510485995
申请日期:2025-04-17
公开号:CN119990127B
公开日期:2025-06-13
类型:发明专利
摘要
本发明提供了一种环保领域文本词向量化方法及相关系统,属于自然语言处理领域。包括如下步骤:获取环保领域文本数据并建立词汇库;基于建立的词汇库构建共现列表,利用动态权重函数计算共现列表中每个单词对的权重值,通过GLOVE模型对权重值高的单词对进行词向量化,生成初始的词向量;基于生成的初始的词向量训练M3E模型,通过In‑batch负采样对比学习和跨模态损失函数联合优化M3E模型,对M3E模型进行优化训练;将文本数据输入训练好的M3E模型,生成文本词向量。通过使用GLOVE模型和M3E模型综合进行词向量化,提供了更丰富的语义信息,能够捕捉单词间的统计关系和单词在不同语境的细微差别。
技术关键词
文本 跨模态 列表 优化训练方法 Sigmoid函数 数据 表格 样本 动态 字典 量化系统 梯度下降法 专业 多层感知机 频率 自然语言 处理器 矩阵 语义 模块
系统为您推荐了相关专利信息
1
域名过滤方法、装置、电子设备及存储介质
域名过滤方法 域名数据库 列表 数值 信息采集模块
2
基于水印嵌入的视频安全保护方法、系统及存储介质
水印嵌入 压缩域 视频 保护方法 加密
3
一种人格评估系统设计方法、装置、存储介质和程序产品
评估系统 数据安全 大语言模型 报告 数据处理模块
4
一种多点温度测量监控方法及系统
温度监控终端 温度传感器 趋势预测模型 监控方法 云端服务器
5
基于排列重要性技术的特征筛选方法及相关系统
特征值 特征选择方法 预训练模型 生成特征 机器学习特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号