摘要
本申请实施例提供了一种对话数据生成方法和装置、电子设备及存储介质,属于金融科技技术领域。该方法包括:获取具有金融领域知识的目标文本;对目标文本进行文本分割,得到多个文本段落;针对每个文本段落,对文本段落进行摘要生成,得到文本段落的目标摘要,并将目标摘要确定为对话回复;通过预设的对话生成模型对对话回复进行问题生成,得到对话回复对应的目标问题;基于对话回复和目标问题,构建初步对话数据;对初步对话数据进行数据增强,得到目标对话数据,对话数据用于作为样本数据对预设的交互对话模型进行训练。本申请实施例能够高效、快捷地扩充用于训练交互对话模型的对话数据的数据量。
技术关键词
文本段落
数据生成方法
对话生成模型
摘要
注意力
数据生成装置
前馈神经网络
编码特征
金融科技技术
电子设备
文本编码器
可读存储介质
话题
处理器
同义词
样本
存储器
系统为您推荐了相关专利信息
疫情预测方法
矩阵
深度神经网络
序列
非平稳数据
凿岩钎具钢
智能分析方法
粒子群优化算法
Pearson相关系数
XGBoost算法
情绪识别方法
编码特征
融合特征
注意力机制
嵌入特征
智能体模型
深度强化学习
电能计量装置
故障诊断方法
一维卷积神经网络
实体链接方法
实体链接模型
输出特征
损失函数优化
更新模型参数