摘要
本申请提供一种语音意图识别方法、电子设备和存储介质,属于数据处理技术领域,该方法包括:接收语音信息,并根据语音信息的触发信息,确定语音信息对应的目标任务类型;根据目标任务类型,为语音信息设置对应的目标输入提示符,目标输入提示符包括文本转录提示符和/或意图识别提示符;将设置有目标输入提示符的语音信息输入至预训练的Whisper模型,调用预训练的Whisper模型对语音信息执行与目标输入提示符对应的操作,并输出执行结果,执行结果包括文本转录结果和/或意图识别结果;获取预训练的Whisper模型输出的执行结果,并执行该执行结果。本申请能够解决现有技术中双模型独立部署导致的资源浪费和累积精度损失问题,同时优化了端侧部署成本。
技术关键词
语音意图识别方法
文本
训练样本集
层级
分类器
解码器
多层感知机
多头注意力机制
重构
前馈神经网络
电子设备
处理器
数据处理技术
序列
程序
系统为您推荐了相关专利信息
初筛方法
面部
随机梯度下降
分类准确率
图像理解技术
视频生成模型
视频生成方法
网络单元
训练样本集
序列