摘要
本发明模型训练数据处理技术领域,提供一种用于大模型训练的数据处理方法,包括:将商品评论文本通过特征情感词组合分词法生成情感标签集合,将商品评论文本通过情感词典词库进行分词生成情感词集合;将情感标签集合和情感词集合依次通过基于心理学模型的关联情感分布模型分别生成第一情感关联分布和第二情感关联分布;将第一情感关联分布和第二情感关联分布通过加权累加计算综合情感强度;将情感词集合和综合情感强度用于对基于改进卷积神经网络的文本情感分析大模型进行商品文本情感强度学习。本发明实现了从心理学角度衡量商品评论文本表达的情绪关联性,进而生成更为准确的数据集标注,减少了文本情感分析大模型对学习数据量的依赖。
技术关键词
数据处理方法
文本情感分析
情感词向量
通道注意力机制
情感特征
生成标签
评论文本表达
情感词典
强度
训练数据处理
情感词库
商品特征
分词
变量
度量
因子
环形
系统为您推荐了相关专利信息
多任务学习策略
表达式
多尺度特征提取
通道注意力机制
弱监督学习
心音分类方法
通道注意力机制
噪声
sigmoid函数
生成对抗网络
深度学习模型
计算机执行指令
人机交互界面
数据库访问
数据处理方法