音频到文本的转换方法及装置、电子设备、存储介质

AITNT
正文
推荐专利
音频到文本的转换方法及装置、电子设备、存储介质
申请号:CN202411543709
申请日期:2024-10-31
公开号:CN119380719A
公开日期:2025-01-28
类型:发明专利
摘要
本公开提供了一种音频到文本的转换方法及装置、电子设备、存储介质,属于语音识别技术领域,该方法包括:对目标音频进行特征提取,得到用于表征目标语音内容的音频特征;基于音频特征的时间序列进行分割处理,得到多个音频段;基于多个音频段生成多个文本段;基于语义模型对多个文本段添加对应的标点符号。本公开提供的音频到文本的转换方法及装置、电子设备、存储介质,能够实现高精度的文本输出。
技术关键词
音频特征 转换方法 文本生成模型 多模态信息融合 电子设备 语音识别技术 可读存储介质 特征提取模块 处理器 序列 语义特征 存储器 计算机
系统为您推荐了相关专利信息
1
一种充电场站决策方案确定方法、装置、设备、介质及产品
充电场站 历史运行状态 决策 样本 充电桩信息
2
一种基于AES的数据增强加密方法、系统、设备及介质
加密方法 消息认证码 明文 密码 哈希算法
3
挖掘机作业场景的感知方法、装置、电子设备和存储介质
超广角镜头 多角度 挖掘机作业 场景 曲面屏显示器
4
语音应答处理方法、装置、电子设备以及存储介质
声纹特征 语义特征 交互式语音应答 资源 训练样本数据
5
预测EGFR TKIs单药治疗NSCLC安全性的评估方法及系统
逻辑回归模型 谷氨酰转移酶 基线 变量 患者
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号