摘要
本公开提供了一种信息处理方法、模型训练方法、装置、设备、介质和产品,涉及计算机技术领域。其中,舆情信息处理方法包括:基于第一语言模型对爬取的原始语言文本进行编码得到原始语言向量,基于第二语言模型对目标语言文本进行编码得到目标语言向量,目标语言文本由原始语言文本翻译生成,第一语言模型为多语言模型;基于原始语言向量和目标语言向量生成句级的第一融合向量和词级的第二融合向量;基于第一融合向量得到对应的主题特征和情感特征;对第二融合向量进行实体提取,得到实体特征;基于主题特征、情感特征和实体特征生成舆情分析结果。通过本公开的技术方案,多特征联合分析增强了舆情关联捕捉能力,能够提升舆情分析的效率和准确性。
技术关键词
舆情信息处理方法
主题特征
情感特征
模型训练方法
文本
预训练模型
标记
线性
数据
地理实体
编码
序列
维特比解码
标签
模型训练装置
条件随机场
系统为您推荐了相关专利信息
语义特征
文本识别模型
敏感信息识别方法
分词模型
文本生成模型
风机故障诊断方法
动态故障
实体间关系
风机故障诊断系统
文本