一种用于大模型训练的数据处理方法

AITNT
正文
推荐专利
一种用于大模型训练的数据处理方法
申请号:CN202510279422
申请日期:2025-03-11
公开号:CN120216695A
公开日期:2025-06-27
类型:发明专利
摘要
本发明模型训练数据处理技术领域,提供一种用于大模型训练的数据处理方法,包括:将商品评论文本通过特征情感词组合分词法生成情感标签集合,将商品评论文本通过情感词典词库进行分词生成情感词集合;将情感标签集合和情感词集合依次通过基于心理学模型的关联情感分布模型分别生成第一情感关联分布和第二情感关联分布;将第一情感关联分布和第二情感关联分布通过加权累加计算综合情感强度;将情感词集合和综合情感强度用于对基于改进卷积神经网络的文本情感分析大模型进行商品文本情感强度学习。本发明实现了从心理学角度衡量商品评论文本表达的情绪关联性,进而生成更为准确的数据集标注,减少了文本情感分析大模型对学习数据量的依赖。
技术关键词
数据处理方法 文本情感分析 情感词向量 通道注意力机制 情感特征 生成标签 评论文本表达 情感词典 强度 训练数据处理 情感词库 商品特征 分词 变量 度量 因子 环形
系统为您推荐了相关专利信息
1
基于多模态数据的焊缝质量检测方法、装置、设备和介质
点云 红外相机 数据 深度学习模型 多模态
2
一种基于覆盖注意力和位置感知的手写数学公式识别方法
多任务学习策略 表达式 多尺度特征提取 通道注意力机制 弱监督学习
3
一种基于样本扩增和噪声注意力网络的心音分类方法
心音分类方法 通道注意力机制 噪声 sigmoid函数 生成对抗网络
4
金融服务数据处理方法、装置、设备及存储介质
深度学习模型 计算机执行指令 人机交互界面 数据库访问 数据处理方法
5
数据处理方法、装置、计算机设备及存储介质
数据迁移 神经网络模型 数据存储 时间段 对象
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号