摘要
本公开提供了基于大模型的交互方法、训练方法、装置及智能体,涉及人工智能领域,尤其涉及语音识别、语音交互、深度学习、大模型等技术领域,可以应用于知识搜索、自动驾驶、智能客服、智能语音控制、智慧电商、AI医疗等应用场景。基于大模型的交互方法包括:获取需求语音;对需求语音进行语音识别,得到表征需求语义的语音识别特征;利用大模型处理语音识别特征,得到回复文本,其中,回复文本包括顺序排列的多个回复字,多个回复字中的目标回复字是基于大模型的注意力融合层处理语音识别特征和关联回复字特征确定的,关联回复字特征与排列在目标回复字之前的关联回复字相关。
技术关键词
语音识别特征
文本
样本
语音特征
特征融合网络
注意力机制
音频特征
子模块
融合特征
解码
语音识别模块
全局特征融合
标签
交互方法
基础
智能语音控制
网络结构
输入模块
系统为您推荐了相关专利信息
遗传算法优化
染色体
过采样技术
记忆单元
网络模型结构
微地震定位方法
水力压裂
深度学习数据集
模型驱动方法
预训练模型
水质监测数据
水质评价方法
可见光遥感图像
红外遥感图像
多光谱遥感图像
页面识别方法
样本
序列
非暂态计算机可读存储介质
数据分布