语音识别方法、装置、电子设备、存储介质和程序产品

AITNT
正文
推荐专利
语音识别方法、装置、电子设备、存储介质和程序产品
申请号:CN202510489152
申请日期:2025-04-17
公开号:CN120183406A
公开日期:2025-06-20
类型:发明专利
摘要
本公开涉及一种语音识别方法、装置、电子设备、存储介质和程序产品。该方法可以包括:获取待识别语音,其中,待识别语音包括唤醒语音和目标语音;将待识别语音输入至预先训练好的语音识别模型中,得到预测文本,预测文本为用于表征目标语音中目标用户的语音内容的文本,目标用户为唤醒语音的说话人;其中,语音识别模型包括语音编码器,语音编码器用于根据待识别语音,得到包括语义特征和说话人特征的第一特征向量,以确定预测文本。如此,在多说话人等声音嘈杂的场景下,能够精准地识别出目标语音中目标用户的语音内容。此外,利用单人语音对语音编码器进行自监督训练,能够有效降低对标注数据的依赖,增强模型泛化能力和适应性。
技术关键词
语音识别模型 语音识别方法 语音编码器 样本 单人 文本 大语言模型 语义特征 语音识别装置 指令 电子设备 处理器 计算机程序产品 可读存储介质 存储器 数据 模块
系统为您推荐了相关专利信息
1
面向视障人士的便携式智能设备实时盲文点检测方法与系统
盲文点检测方法 面向视障人士 便携式智能设备 通道注意力机制 对比度
2
一种人物形象图像生成方法和装置、电子设备及存储介质
语义特征 融合特征 偏好特征 文本 图像特征编码
3
一种表情可控的人脸视频风格编辑方法
风格 编辑方法 语音编码器 人脸 语音特征
4
一种基于模块化数据的物联网云监控系统
数据分析模型 云监控系统 监控设备 数据分析模块 数据采集模块
5
一种面向机坪管制的空管指令识别与航空器行为预警方法
航空器 预警方法 指令 语义特征 路段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号