训练数据获取方法及系统、语音识别方法、设备及介质

AITNT
正文
推荐专利
训练数据获取方法及系统、语音识别方法、设备及介质
申请号:CN202510574081
申请日期:2025-05-06
公开号:CN120260551A
公开日期:2025-07-04
类型:发明专利
摘要
本申请提供一种训练数据获取方法及系统、语音识别方法、设备及介质,所述训练数据获取方法包括:从长视频中提取多个人声片段;计算多个所述人声片段与所述长视频的音频差值;基于所述音频差值确定有效人声片段;对所述有效人声片段进行语音识别,获取初筛识别结果;基于所述初筛识别结果确定有效转写结果;将所述有效人声片段和所述有效转写结果作为语音识别训练数据。本申请能够利用现成的长视频及其语音转写文本,构造语音识别训练数据,增强了训练数据获取效率与精度,有助于语音识别模型训练,并且不需要大量的硬件资源进行支撑。
技术关键词
训练数据获取方法 人声 语音识别训练 语音识别方法 语音识别模型 视频 音频 文本 数据获取系统 数据模块 电子设备 识别模块 可读存储介质 存储器 处理器 字符
系统为您推荐了相关专利信息
1
语音识别报警方法及存储介质、计算机设备
语音识别程序 蜂鸣器控制电路 语音识别报警 电网调度监控 电子定时器
2
用户画像的生成方法及装置
生成方法 语音识别模型 文本 画像技术 生成装置
3
电子设备、服务器及声音处理方法
电子设备 数据 声音采集器 文本 服务器建立通信
4
一种全骨导脑机振动拾音装置及其方法
骨传导传感器 采样点 信号处理模块 拾音装置 信号采集模块
5
基于大模型意图优化的多语种智能语音问答方法
智能语音问答方法 意图 语音识别模型 响应用户需求 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号