摘要
本公开的语音助手模型的训练数据合成方法、语音助手系统及计算机设备,包括收集当前语音助手模型的线上实际用户数据,实际用户数据包括当前语音助手模型接收的语音文本数据。基于预设提示信息,采用大模型对实际用户数据进行数据筛选,获取筛选数据,预设提示信息包括数据完整度、数据清晰度和数据连贯度。采用大模型根据筛选数据合成目标迭代数据。采用大模型对目标迭代数据添加用途标注;对完成用途标注的目标迭代数据进行审核,并对审核不合格的目标迭代数据修改用途标注;采用审核后的目标迭代数据训练语音助手模型;将完成训练后的语音助手模型替换当前语音助手模型,并更新收集的实际用户数据。
技术关键词
样本
数据
语音助手系统
模型训练模块
计算机设备
训练集
文本
存储器
处理器
标记
系统为您推荐了相关专利信息
地质矿产勘查装置
覆盖率
数据采集周期
数据采集精度
指数
边缘网关设备
物联网设备数据
像素
边缘计算方法
图像
电气设备
管理算法
监测管理方法
变电站
卷积神经网络模型