摘要
本申请提供了一种文本数据生成方法。可以应用于大数据技术领域和人工智能技术领域。该方法包括:获取第一时域语音信号,对所述第一时域语音信号进行预处理,生成多个第二时域语音信号。对所述多个第二时域语音信号进行声学特征提取,生成特征向量。将所述特征向量输入预先训练的语音处理模型,输出每个时间步的文件标签的概率分布。对所述每个时间步的文件标签的概率分布进行动态解码,生成文件标签的最优词语序列。以及对所述最优词语序列进行文本处理,生成目标文本数据。本申请还提供了一种文本数据生成装置、设备、存储介质和程序产品。
技术关键词
梅尔频率倒谱系数
生成特征向量
文本数据生成方法
语音
动态解码
词语
信号
数据生成装置
标签
序列
离散余弦
递归算法
人工智能技术
计算机程序产品
处理器
自然语言
模块
系统为您推荐了相关专利信息
网络异常检测方法
主机
统计特征
时序神经网络
非易失性存储介质
分诊系统
卷积神经网络模型
医疗交互
多模态数据融合
5G无线通信技术
软弱围岩隧道
隧道变形监测
变形智能
监测方法
支持向量回归模型