摘要
本申请公开了一种基于大模型的语音交互任务执行方法、装置、设备及介质,涉及人工智能领域,包括:对语音特征进行语音识别获得文本字符序列,利用预设大语言模型对文本字符序列进行优化得到目标文本字符序列;利用预设大语言模型对目标文本字符序列进行实体识别得到实体识别结果,根据实体识别结果确定目标文本字符序列中各实体之间的关系类型,根据各实体之间的关系类型构建知识图谱;基于知识图谱生成初始三元组并利用预设大语言模型对初始三元组进行优化得到目标三元组;将目标三元组与初始知识图谱进行融合,并基于更新后的知识图谱执行目标语音交互场景中的语音交互任务。本申请提高了从中文语音中抽取结构化知识的效率和准确性。
技术关键词
大语言模型
三元组
语音交互场景
语音特征
字符
文本
实体
序列
构建知识图谱
语音识别模型
梅尔频率倒谱系数
数据
关系
深度学习算法
注意力机制
背景噪声
执行装置
模块
系统为您推荐了相关专利信息
意图识别方法
大语言模型
推理机制
语音采集模块
泄露用户隐私
信息预警方法
识别网络信息
预警规则
大语言模型
语义向量
纺织
算法推荐方法
大语言模型
推荐算法
生成方法