摘要
本申请公开了一种数据抽检方法、装置、设备和存储介质,该方法包括:获取若干目标语音分别对应的识别文本;对各识别文本进行文本校对处理,得到对应的校对文本;基于各识别文本和对应校对文本之间的差异程度,将若干校对文本划分为多个第一校对文本组;从各第一校对文本组中抽取校对文本,作为样本文本。通过上述方式,本申请能够提高抽样的准确性。
技术关键词
文本
抽检方法
样本
语音识别模型
抽检装置
可读存储介质
处理器
存储器
程序
指令
模块
计算机
数据
序列
电子设备
系统为您推荐了相关专利信息
生成系统
特征提取模块
玩家
自然语言生成技术
文本
心理压力检测方法
样本
数据
神经网络模型
注意力机制