摘要
本发明提供一种基于大语言模型的智能语音交互方法及设备,接收语音交互端发送的交互指令,以及交互指令对应的交互音频数据,基于大语言模型对交互音频数据进行音色分析,生成预测数值段,并调取与交互指令对应的播报语句;基于预测数值段调取相应绑定端设置的绑定人员的基础信息,根据基础信息对播报语句进行展示定制,得到展示字号;获取采集装置采集环境噪音,根据相应基础信息和环境噪音对播报语句中播报字符的字符间隔时长和播报音量进行播报定制调整,得到相邻播报字符的定制间隔时长和定制音量;根据展示字号将播报语句发送至语音交互端的展示界面进行展示,基于定制间隔时长和定制音量控制语音交互端播放播报语句。
技术关键词
年龄
字符
大语言模型
智能语音交互方法
语句
展示页面
波形
展示界面
基础
数值
智能语音交互设备
噪声音量
音频
指令
基准
数据
系统为您推荐了相关专利信息
舆情分析方法
情感分析模型
关键词
语义
河流生态环境
智能语音交互系统
动态上下文
多线程
语音输入模块
语音识别模块