摘要
本发明提供了一种环保领域文本词向量化方法及相关系统,属于自然语言处理领域。包括如下步骤:获取环保领域文本数据并建立词汇库;基于建立的词汇库构建共现列表,利用动态权重函数计算共现列表中每个单词对的权重值,通过GLOVE模型对权重值高的单词对进行词向量化,生成初始的词向量;基于生成的初始的词向量训练M3E模型,通过In‑batch负采样对比学习和跨模态损失函数联合优化M3E模型,对M3E模型进行优化训练;将文本数据输入训练好的M3E模型,生成文本词向量。通过使用GLOVE模型和M3E模型综合进行词向量化,提供了更丰富的语义信息,能够捕捉单词间的统计关系和单词在不同语境的细微差别。
技术关键词
文本
跨模态
列表
优化训练方法
Sigmoid函数
数据
表格
样本
动态
字典
量化系统
梯度下降法
专业
多层感知机
频率
自然语言
处理器
矩阵
语义
模块
系统为您推荐了相关专利信息
域名过滤方法
域名数据库
列表
数值
信息采集模块
评估系统
数据安全
大语言模型
报告
数据处理模块
温度监控终端
温度传感器
趋势预测模型
监控方法
云端服务器
特征值
特征选择方法
预训练模型
生成特征
机器学习特征