摘要
本发明涉及一种智能语音机器人转接人工的决策方法,属于语音识别技术领域,解决了现有人工转接决策不准确的问题。包括将用户音频转换为语音文本后传入大语言模型,识别出用户意图,从知识库中检索出与用户意图最相似的多条语料文本;如果最高相似度不超过阈值,则转接人工;否则,随机抽样多条语料文本计算相似度均值,当相似度均值等于0时转接人工;当相似度均值大于0时,将用户音频的MFCC特征和语音文本的词嵌入向量传入多模态综合模型,输出语音文本中每个词的语音情绪值和情感状态值;根据每个词的权重、语音情绪值、情感状态值和相似度均值计算出转接指数,当转接指数小于0时转接人工。实现了转接决策准确性的提高。
技术关键词
智能语音机器人
决策方法
文本
音频
交叉注意力机制
大语言模型
模块
多模态
指数
意图
语音识别技术
注意力模型
矩阵