摘要
本申请涉及一种实时场景手势生成方法、设备、数字人交互系统,属于人工智能技术领域。本申请通过获取输入文本;采用动作生成模型,基于所述输入文本生成数字人的基础手势动作;采用相似度匹配方法,从预先建立的语义增强数据集中检索出与所述输入文本对应的索引语义动作;将所述索引语义动作叠加到所述基础手势动作的序列中,生成数字人的手势动作。本申请通过引入大模型技术,批量生成准确的语义手势的语义文本描述,通过词向量相似度计算来进行检索匹配,并将索引语义动作叠加在讲话数字人的生成过程,来增强数字人手势表达的语义效果,在保证实时效果的前提下实现语言文本语义内容和手势内容表达的统一。
技术关键词
手势生成方法
语义
文本
索引
场景
交互系统
贝塞尔曲线插值
插值法
基础
生成设备
序列
人工智能技术
数据
分词
意图
处理器
可读存储介质
存储器