摘要
本申请提供一种语音识别模型训练方法及版画生成方法、版画生成系统,涉及金融科技领域或其他相关领域。语音识别模型训练方法包括:通过正交分解提取样本音频数据中的纯净图片内容描述信息和纯净情感倾向信息,样本音频数据用于生成图片,纯净图片内容描述信息描述样本音频数据对应的图片的图像内容,纯净情感倾向信息描述样本音频数据对应的图片的情感倾向;根据纯净图片内容描述信息、纯净情感倾向信息,通过损失函数计算损失值,并根据损失值更新语音识别模型的权重参数。通过正交分解,语音识别模型可以将音频信号分解为内容相关和情感相关的特征,从而在生成图片时更好地结合这些信息,使生成的风格图片可以满足用户需求。
技术关键词
语音识别模型
图像内容特征
图片
版画
计算机执行指令
生成方法
样本
数据
风格
生成系统
音频信号分解
语音识别模块
可读存储介质
参数
计算机程序产品
处理器
训练装置
系统为您推荐了相关专利信息
运动状态信息
对象
无人机
计算机执行指令
碾压方法
交易特征
账号
神经网络模型
交易识别方法
节点特征
个性化定制系统
关键词
事件主体
个性化定制方法
文本
特征提取器
识别方法
样本
更新模型参数
通用特征