一种基于人工智能的智能音箱语音处理方法及系统

正文

推荐专利

申请号：CN202510742267

申请日期：2025-06-05

公开号：CN120544551A

公开日期：2025-08-26

类型：发明专利

摘要

本发明提出一种基于人工智能的智能音箱语音处理方法及系统，包括：获取音频数据和口型视频数据，对两者进行处理后执行多模态特征融合，得到融合特征；对融合特征进行双模态语音活动检测，获得有效语音数据；对有效语音数据进行音视频融合的上下文感知识别，得到第一文本；构建用户特征模型，基于该模型对文本进行语义理解，得到理解结果；基于理解结果进行意图识别和槽位填充，获得用户意图和关键信息；结合用户意图、关键信息和环境感知数据，生成响应策略；根据响应策略生成响应语音；实时监测用户对响应语音的反馈信息，基于反馈更新用户特征模型和响应策略评估模型。通过本方案，能更准确地识别语音并增强系统的安全性和鲁棒性。

技术关键词

智能音箱环境感知数据意图识别语义声学特征融合特征多模态特征融合音频语音活动检测文本视觉注意力序列协同控制策略意图类别

系统为您推荐了相关专利信息

一种基于异构分支的高压断路器声纹缺陷识别方法和系统

缺陷识别方法高压断路器注意力特征提取器特征提取模块

基于二维码的超声报告智能解读与医患交互系统

医患交互系统生成动态二维码报告安全监控模块可视化界面

一种融合认知心理学的资金预算方法、装置和电子设备

资金账户预算方法心理企业业务系统

一种流量数据的快速分类分级方法、系统及介质

分类分级方法指纹文本数据标签明文

智能营销文案生成方法、装置、设备及存储介质

文案生成方法智能营销技术数据语义向量样本

一种基于人工智能的智能音箱语音处理方法及系统

站点导航

APP 下载