摘要
本发明属于人工智能领域,具体涉及一种基于AI的文字及声音获取、分析及生成方法,包括以下步骤,获取文字、语音数据集;对预处理后的文本数据通过TF‑IDF算法计算某个单词在文本中的出现频率与在整个语料库中的出现频率之比来衡量其重要性;对预处理后的音频数据采用双频变换提取机制FT‑WT,将一个时域信号转换成频域信号的方法,得到信号的频域特征;提取到的特征信息注入循环神经网络进行训练。本申请在数据特征提取的过程中,利用傅里叶及小波变换对数据进行整合处理,以获得更全面的音频信息;计算音频信号的FT_WT值,来增加信号的动态范围,提高信噪比,进而更加准确的描述音频信号,提高人机交互的准确性及实用性。
技术关键词
生成方法
音频
循环神经网络模型
数据并行处理
语音
频域特征
文本
数据特征提取
频率
信噪比
信号值
重构
波形
机制
算法
动态
词语
指数
系统为您推荐了相关专利信息
故障场景
深度神经网络
电力系统仿真软件
生成方法
时间卷积网络
协同审核方法
决策
视频特征向量
图像特征向量
梯度算法