语音识别方法和装置、电子设备及存储介质

AITNT
正文
推荐专利
语音识别方法和装置、电子设备及存储介质
申请号:CN202411465060
申请日期:2024-10-18
公开号:CN119360845B
公开日期:2025-12-09
类型:发明专利
摘要
本申请提供了一种语音识别方法和装置、电子设备及存储介质,属于金融科技技术领域。方法包括:获取包含多个说话人的目标语音数据;基于语音识别模型对目标语音数据进行编码处理,得到语音编码特征,语音识别模型包括语音识别网络、和说话人识别网络;基于语音识别网络对语音编码特征进行内容识别,得到目标语音数据对应的语音文本内容;基于说话人识别网络对目标语音数据、和语音编码特征进行说话人识别,得到目标语音数据对应的说话人声纹特征;基于说话人声纹特征,对语音文本内容中的各个文本字符进行分类,得到每个说话人所产生的目标语音内容,目标语音内容由多个文本字符组成。本申请能够提高对包含多个说话人的语音的识别准确性。
技术关键词
声纹特征 说话人识别 语音识别网络 语音编码 语音识别方法 语音识别模型 样本 文本 字符 数据 解码器 音频编码 语音识别装置 编码特征 金融科技技术 电子设备 标识
系统为您推荐了相关专利信息
1
视频通信方法及装置、计算机可读存储介质、电子设备
声纹特征 视频通信方法 动画 韵律特征 实时通信
2
一种基于专家路由门限的高效同声传译方法
后处理模块 同声传译方法 语音编码器 共享语言模型 离线
3
音唇同步检测方法和装置、电子设备、存储介质
模态特征 语音编码 音频特征 去噪模型 样本
4
一种羊采食行为的声音识别系统
声音识别系统 声音采集模块 颈部可穿戴装置 压电纤维阵列 环境光照强度
5
一种显示设备及语音识别方法
语音识别模型 显示设备 文本 发音 语音识别方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号