摘要
本申请属于人工智能技术领域,涉及一种基于人工智能的语音处理方法、装置、计算机设备及存储介质,包括:接收用户通过语音设备输入的语音指令;基于语音编码器对语音指令进行特征提取得到语音特征;基于语音适配器对语音特征进行调整处理得到目标语音特征;基于大型语言模型对目标语音特征进行推理处理生成目标文本;基于语音解码器对目标文本进行解码处理得到回复语音;基于质量优化策略对回复语音进行优化处理得到目标回复语音;基于播放控制策略将目标回复语音传输至语音设备。此外,本申请还涉及区块链技术,目标回复语音可存储于区块链中。本申请可应用于金融领域与医疗领域中的语音交互场景,通过本申请有效地提高了语音交互的处理效率。
技术关键词
语音特征
语音适配器
语音设备
语音解码器
控制策略
文本
计算机可读指令
语音编码器
计算机设备
语音交互场景
可读存储介质
人工智能技术
区块链技术
噪声抑制
解码模块
传输模块
系统为您推荐了相关专利信息
功率优化系统
涡轮发电机
高原
多物理场建模
状态空间方程
PID算法
闭环反馈控制
滤波技术
智能控制方法
充电端口
数据安全共享方法
能源管理
智能传感器
能耗
访问控制模型
稳定工作模式
自动控制方法
风险
特征提取模型
指标
语音识别网络
语音特征
文本
计算机可执行指令
样本