音频到文本的转换方法及装置、电子设备、存储介质

正文

推荐专利

申请号：CN202411543709

申请日期：2024-10-31

公开号：CN119380719A

公开日期：2025-01-28

类型：发明专利

摘要

本公开提供了一种音频到文本的转换方法及装置、电子设备、存储介质，属于语音识别技术领域，该方法包括：对目标音频进行特征提取，得到用于表征目标语音内容的音频特征；基于音频特征的时间序列进行分割处理，得到多个音频段；基于多个音频段生成多个文本段；基于语义模型对多个文本段添加对应的标点符号。本公开提供的音频到文本的转换方法及装置、电子设备、存储介质，能够实现高精度的文本输出。

技术关键词

音频特征转换方法文本生成模型多模态信息融合电子设备语音识别技术可读存储介质特征提取模块处理器序列语义特征存储器计算机

系统为您推荐了相关专利信息

一种充电场站决策方案确定方法、装置、设备、介质及产品

充电场站历史运行状态决策样本充电桩信息

一种基于AES的数据增强加密方法、系统、设备及介质

加密方法消息认证码明文密码哈希算法

挖掘机作业场景的感知方法、装置、电子设备和存储介质

超广角镜头多角度挖掘机作业场景曲面屏显示器

语音应答处理方法、装置、电子设备以及存储介质

声纹特征语义特征交互式语音应答资源训练样本数据

预测EGFR TKIs单药治疗NSCLC安全性的评估方法及系统

逻辑回归模型谷氨酰转移酶基线变量患者

音频到文本的转换方法及装置、电子设备、存储介质

站点导航

APP 下载