一种基于人工智能的智能音箱语音处理方法及系统

AITNT
正文
推荐专利
一种基于人工智能的智能音箱语音处理方法及系统
申请号:CN202510742267
申请日期:2025-06-05
公开号:CN120544551A
公开日期:2025-08-26
类型:发明专利
摘要
本发明提出一种基于人工智能的智能音箱语音处理方法及系统,包括:获取音频数据和口型视频数据,对两者进行处理后执行多模态特征融合,得到融合特征;对融合特征进行双模态语音活动检测,获得有效语音数据;对有效语音数据进行音视频融合的上下文感知识别,得到第一文本;构建用户特征模型,基于该模型对文本进行语义理解,得到理解结果;基于理解结果进行意图识别和槽位填充,获得用户意图和关键信息;结合用户意图、关键信息和环境感知数据,生成响应策略;根据响应策略生成响应语音;实时监测用户对响应语音的反馈信息,基于反馈更新用户特征模型和响应策略评估模型。通过本方案,能更准确地识别语音并增强系统的安全性和鲁棒性。
技术关键词
智能音箱 环境感知数据 意图识别 语义 声学特征 融合特征 多模态特征融合 音频 语音活动检测 文本 视觉 注意力 序列 协同控制策略 意图类别
系统为您推荐了相关专利信息
1
一种基于异构分支的高压断路器声纹缺陷识别方法和系统
缺陷识别方法 高压断路器 注意力 特征提取器 特征提取模块
2
基于二维码的超声报告智能解读与医患交互系统
医患交互系统 生成动态二维码 报告 安全监控模块 可视化界面
3
一种融合认知心理学的资金预算方法、装置和电子设备
资金 账户 预算方法 心理 企业业务系统
4
一种流量数据的快速分类分级方法、系统及介质
分类分级方法 指纹 文本 数据标签 明文
5
智能营销文案生成方法、装置、设备及存储介质
文案生成方法 智能营销技术 数据 语义向量 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号