一种基于非遗大模型的多模态实时互动系统和方法

AITNT
正文
推荐专利
一种基于非遗大模型的多模态实时互动系统和方法
申请号:CN202511032085
申请日期:2025-07-25
公开号:CN120852712A
公开日期:2025-10-28
类型:发明专利
摘要
本申请提供一种基于非遗大模型的多模态实时互动系统和方法,所述系统包括:自动语音识别模块、语音合成模块、非遗大模型模块、数字人渲染模块,所述自动语音识别模块通过麦克风实时采集用户语音信号;所述非遗大模型模块用于处理用户输入的多模态数据,生成相应的响应文本;所述语音合成模块用于文字转语音,实现声音克隆、情感调节和多语言输出;所述数字人渲染模块在非遗大模型的基础上加上3D身体,构建高保真3D数字人模型,通过动作捕捉或AI驱动实现实时表情与肢体动作同步。本申请借助大语言模型在非遗基础上进行文化再创造,深入挖掘非遗文化中蕴含的精神财富,可以实现非遗文化的智能化传播与知识普及。
技术关键词
自动语音识别 互动系统 大语言模型 语音活动检测 检测语音活动 互动方法 数据 非物质文化遗产 中文分词工具 模块 动作同步 翻译工具 文本 生成动画 深度学习模型 句法结构 预训练模型 多轮对话 高性能
系统为您推荐了相关专利信息
1
基于知识图谱的检索增强生成方法、装置、设备及介质
知识图谱数据库 文本 模式 生成方法 节点
2
一种针对航天器目标类型与属性分类的图像标注方法
图像标注方法 航天器 模板 基准 标签体系
3
一种基于大语言模型的经验学习自适应预瞄控制方法
大语言模型 货架托盘 记忆 轨迹 场景
4
资源召回方法、装置、电子设备和存储介质
文本 深度学习模型 资源库 样本 语义
5
一种基于智能体技术的政务热线诉求知识图谱构建方法
知识图谱构建方法 智能体技术 实体 政务 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号