训练数据获取方法及系统、语音识别方法、设备及介质

正文

推荐专利

申请号：CN202510574081

申请日期：2025-05-06

公开号：CN120260551A

公开日期：2025-07-04

类型：发明专利

摘要

本申请提供一种训练数据获取方法及系统、语音识别方法、设备及介质，所述训练数据获取方法包括：从长视频中提取多个人声片段；计算多个所述人声片段与所述长视频的音频差值；基于所述音频差值确定有效人声片段；对所述有效人声片段进行语音识别，获取初筛识别结果；基于所述初筛识别结果确定有效转写结果；将所述有效人声片段和所述有效转写结果作为语音识别训练数据。本申请能够利用现成的长视频及其语音转写文本，构造语音识别训练数据，增强了训练数据获取效率与精度，有助于语音识别模型训练，并且不需要大量的硬件资源进行支撑。

技术关键词

训练数据获取方法人声语音识别训练语音识别方法语音识别模型视频音频文本数据获取系统数据模块电子设备识别模块可读存储介质存储器处理器字符

系统为您推荐了相关专利信息

语音识别报警方法及存储介质、计算机设备

语音识别程序蜂鸣器控制电路语音识别报警电网调度监控电子定时器

用户画像的生成方法及装置

生成方法语音识别模型文本画像技术生成装置

电子设备、服务器及声音处理方法

电子设备数据声音采集器文本服务器建立通信

一种全骨导脑机振动拾音装置及其方法

骨传导传感器采样点信号处理模块拾音装置信号采集模块

基于大模型意图优化的多语种智能语音问答方法

智能语音问答方法意图语音识别模型响应用户需求文本

训练数据获取方法及系统、语音识别方法、设备及介质

站点导航

APP 下载