摘要
本发明涉及数据处理领域,尤其涉及一种基于双阶段扩散模型的情感分析数据增强方法,包括:获取原始评论文本数据集并预处理;建立Transformer模型和Diffusion模型进行预训练;将量化文本表示输入到训练好的Transformer模型中,实现全局语义表征的建模与提取;采用训练好的Diffusion模型在全局语义表征的嵌入空间提取得到伪样本;构建基于Diffusion架构的奖励评估模型,筛选出最优样本并合并至原始数据集中。本发明的有益效果在于:提升了模型对复杂情感语义的理解能力,直接扩充高质量、多样化且情感特征鲜明的文本情感数据,有效解决了情感分析任务中数据确数据稀缺和分布不均衡的问题。
技术关键词
文本
语义
样本
噪声预测
阶段
数据
网格
投影模块
分布式表征
标签
编码器
字符
生成框架
交互机制
噪声特征
情感特征
多层感知机
噪声强度
参数
系统为您推荐了相关专利信息
评估肝细胞癌
图像分割方法
医学图像数据集
网络
中子
面料疵点
实时图像
神经网络模型
摄像单元
输送单元
频谱特征
语义特征
音频特征
融合特征
多层感知机