基于语音控制的多模态智能终端AI语音唤醒方法和装置

正文

推荐专利

申请号：CN202511376125

申请日期：2025-09-25

公开号：CN120853549A

公开日期：2025-10-28

类型：发明专利

摘要

本发明涉及语音分析技术领域，具体涉及基于语音控制的多模态智能终端AI语音唤醒方法和装置，包括：利用语音模型提取每个语音样本的特征，利用视频模型提取每个面部动作样本的特征；包含唤醒语音的语音样本的记为正样本，不包含唤醒语音的语音样本记为负样本，利用正、负样本对应的面部动作样本的特征更新语音模型的参数以及更新正、负样本对应的面部动作样本，然后利用更新后的面部动作样本更新视频模型的参数；并重复上述参数更新过程。本发明在不显著增加模型参数的前提下，实现复杂且多变的语音环境下高效、准确的语音唤醒功能。

技术关键词

AI语音样本唤醒方法智能终端生成向量视频面部关键点检测参数语音分析技术语音唤醒功能麦克风曲线直方图唤醒装置人脸相机处理器

系统为您推荐了相关专利信息

高速列车地板结构木骨支撑体隔声预测优化方法及装置

列车地板决策树模型优化装置混响时间剪切模量

一种支持在线快速评估的异常检测智能推荐方法

智能推荐方法智能模型分布参数模型在线模型推荐方法

基于多模态检索增强和指南引导的医疗诊断方法和系统

医疗诊断方法医学影像信息多模态医学知识库视觉特征

地下水系统含水层参数反演方法和装置、系统、存储介质

地下水系统参数反演方法拉丁超立方抽样方法深度神经网络反演装置

基于堆叠网络模型对稀疏小样本工业过程质量预测的方法

集成学习模型条件生成对抗网络超参数样本变量

基于语音控制的多模态智能终端AI语音唤醒方法和装置

站点导航

APP 下载