一种面向教学的多模态交互式数字人助教生成方法

正文

推荐专利

申请号：CN202510639063

申请日期：2025-05-19

公开号：CN120492587A

公开日期：2025-08-15

类型：发明专利

摘要

本发明公开了一种面向教学的多模态交互式数字人助教生成方法，属于人工智能教育技术领域，通过多模态输入(语音、文本、肖像图)，结合语义增强问答模型(SE‑QA)生成结构化答案；使用情感适配语音合成技术生成个性化语音；构建教学动作视频库，利用时空图卷积网络(ST‑GCN)提取动作特征，并通过时序卷积网络(TCN)生成视频，优化音唇同步与微表情；通过多模态评价与强化学习优化生成过程，实现“生成‑评价‑优化”闭环。本发明采用上述的一种面向教学的多模态交互式数字人助教生成方法，突破了传统数字人系统语义‑动作失配、情感表达单一等技术瓶颈，能显著提升知识传递效率与交互真实感，为智能教育工具提供了创新解决方案。

技术关键词

交互式数字教学动作生成方法视频教学场景生成个性化语音答案评价反馈系统音唇同步动态时间规整算法情感特征文本语义向量强化学习框架跨模态注意力语义关联度人工智能教育技术

系统为您推荐了相关专利信息

一种甲状腺超声图像诊断报告自动生成方法

甲状腺超声图像报告自动生成方法特征提取模型超声医学图像处理微调方法

一种摄像头图像信号处理方法及系统

图像信号处理方法编码码率视频流传输动态码率加密算法

基于鸟类姿态和图像质量的鸟类识别方法和装置

图像鸟类识别方法视频序列姿态识别模型

一种利用大数据分析的实训结果评估系统

评估系统数据获取模块数据模块视频帧集合粒子

角色对话生成方法、装置、设备及介质

对话生成方法融合特征文本编码器输入解码器

一种面向教学的多模态交互式数字人助教生成方法

站点导航

APP 下载