摘要
本申请涉及人工智能技术领域,具体涉及一种数字人唤醒和交互方法及计算设备,该方法应用于计算设备,包括:按照预设频次,周期性获取视频帧;在当前视频帧中存在交互人物的情况下,利用视频理解模型进行特征提取,得到目标交互人物的人物特征;基于人物特征确定目标交互人物是否属于目标交互群体;在目标交互人物属于目标交互群体的情况下,基于目标交互人物的物理状态唤醒数字人进行多模态交互,并基于多模态交互结果执行业务处理流程。该方法可以在出现交互人物时,对交互人物进行特征提取,以确定交互人物的人物意图,进而可以主动与交互人物进行多模态交互,以对交互人物提供业务支持,交互人物无需主动发起交互,能够提升使用体验。
技术关键词
多模态交互
人物特征
交互方法
视频帧
意图
多轮对话
脸部特征
物理
特征匹配算法
业务系统
动作交互
姿态特征
人工智能技术
运动特征
周期性
处理器
门禁
程序
系统为您推荐了相关专利信息
视频风格迁移方法
生成器网络
编码器
面部
时空注意力机制
查询方法
关键词
构建知识图谱
意图识别
查询意图
风险检测方法
大语言模型
关键词
意图识别
输入端
客服
语义意图
多任务学习网络
电话
情绪智能分析技术