摘要
本申请公开了一种声学语义大模型、服务器、语音交互方法和计算机可读存储介质。声学语义大模型包括声学编码模块、字符转写模块、知识检索模块和大语言模型模块。声学编码模块被配置为根据输入的语音请求,生成语音请求的声学特征向量。字符转写模块被配置为将语音请求转写为相对应的字符序列,字符序列包括语音请求中各文字相对应的字符。知识检索模块被配置为根据字符序列,自外部知识库中,获取补充信息。大语言模型模块被配置为根据声学特征向量和补充信息,确定自然语言处理结果。如此,通过端到端的声学语义大模型,减少了多个模块的串行处理,降低了处理语音请求的时延,提升了模型响应速度,从而增强用户体验。
技术关键词
语音交互方法
字符
语义
大语言模型
槽位识别
编码模块
自然语言
声学特征
序列
车辆控制指令
服务器
可读存储介质
生成语音
处理器
接口
存储器
计算机
汉字
系统为您推荐了相关专利信息
数据智能管理方法
动态知识图谱
强化学习模型
差分隐私机制
智能调度系统
位置偏移检测方法
柱上断路器
像素点
电线杆
协方差矩阵
语句生成方法
大语言模型
文本
训练样本数据
语义