一种基于非遗大模型的多模态实时互动系统和方法

正文

推荐专利

申请号：CN202511032085

申请日期：2025-07-25

公开号：CN120852712A

公开日期：2025-10-28

类型：发明专利

摘要

本申请提供一种基于非遗大模型的多模态实时互动系统和方法，所述系统包括：自动语音识别模块、语音合成模块、非遗大模型模块、数字人渲染模块，所述自动语音识别模块通过麦克风实时采集用户语音信号；所述非遗大模型模块用于处理用户输入的多模态数据，生成相应的响应文本；所述语音合成模块用于文字转语音，实现声音克隆、情感调节和多语言输出；所述数字人渲染模块在非遗大模型的基础上加上3D身体，构建高保真3D数字人模型，通过动作捕捉或AI驱动实现实时表情与肢体动作同步。本申请借助大语言模型在非遗基础上进行文化再创造，深入挖掘非遗文化中蕴含的精神财富，可以实现非遗文化的智能化传播与知识普及。

技术关键词

自动语音识别互动系统大语言模型语音活动检测检测语音活动互动方法数据非物质文化遗产中文分词工具模块动作同步翻译工具文本生成动画深度学习模型句法结构预训练模型多轮对话高性能

系统为您推荐了相关专利信息

基于知识图谱的检索增强生成方法、装置、设备及介质

知识图谱数据库文本模式生成方法节点

一种针对航天器目标类型与属性分类的图像标注方法

图像标注方法航天器模板基准标签体系

一种基于大语言模型的经验学习自适应预瞄控制方法

大语言模型货架托盘记忆轨迹场景

资源召回方法、装置、电子设备和存储介质

文本深度学习模型资源库样本语义

一种基于智能体技术的政务热线诉求知识图谱构建方法

知识图谱构建方法智能体技术实体政务文本

一种基于非遗大模型的多模态实时互动系统和方法

站点导航

APP 下载