一种基于AI的文字及声音获取、分析及生成方法

正文

推荐专利

申请号：CN202410979694

申请日期：2024-07-22

公开号：CN118824226A

公开日期：2024-10-22

类型：发明专利

摘要

本发明属于人工智能领域，具体涉及一种基于AI的文字及声音获取、分析及生成方法，包括以下步骤，获取文字、语音数据集；对预处理后的文本数据通过TF‑IDF算法计算某个单词在文本中的出现频率与在整个语料库中的出现频率之比来衡量其重要性；对预处理后的音频数据采用双频变换提取机制FT‑WT，将一个时域信号转换成频域信号的方法，得到信号的频域特征；提取到的特征信息注入循环神经网络进行训练。本申请在数据特征提取的过程中，利用傅里叶及小波变换对数据进行整合处理，以获得更全面的音频信息；计算音频信号的FT_WT值，来增加信号的动态范围，提高信噪比，进而更加准确的描述音频信号，提高人机交互的准确性及实用性。

技术关键词

生成方法音频循环神经网络模型数据并行处理语音频域特征文本数据特征提取频率信噪比信号值重构波形机制算法动态词语指数

系统为您推荐了相关专利信息

一种基于TCN-CVAE深度神经网络的电网故障场景生成方法及系统

故障场景深度神经网络电力系统仿真软件生成方法时间卷积网络

基于循环反馈的任务自适应生成方法、系统、存储介质及电子设备

生成方法列表模板简化型电子设备

基于多模态的智能体协同审核方法及系统

协同审核方法决策视频特征向量图像特征向量梯度算法

一种业务承载能力评估的方法

栅格人工神经网络指标采样点终端

一种信息图生成方法、装置、设备及可读存储介质

可视化图表摘要模板布局结构数据

一种基于AI的文字及声音获取、分析及生成方法

站点导航

APP 下载