多模态自然语言理解与生成系统及方法

正文

推荐专利

多模态自然语言理解与生成系统及方法

申请号：CN202510775807

申请日期：2025-06-11

公开号：CN120670635A

公开日期：2025-09-19

类型：发明专利

摘要

本发明公开了多模态自然语言理解与生成系统及方法。方法包括：构建跨模态预训练模块，训练多模态编码器，建立跨模态联想映射空间；进行混合提示微调，构建完型填空模板；根据意图推理网络，提取用户多轮对话意图表征，检索外部知识库进行细粒度推理；构建统一语义表征框架，将文本、图像、语音嵌入统一空间，生成多模态意图感知的查询向量；基于键值记忆的知识查询模块，生成实体级多模态回复，优化对话模型语义理解与生成能力。本发明提升了多模态信息理解与生成能力，实现了图像与文本信息深度关联与理解，增强了下游任务适应性，提高了任务完成准确性和效率，实现了多模态信息统一语义表征，为信息检索与利用提供了支持。

技术关键词

自然语言理解跨模态意图推理网络生成系统文本语义图像多轮对话模块主题分类器锚点注意力机制实体编码器多模态特征记忆机制键值

系统为您推荐了相关专利信息

一种生成式AI驱动的语音点单与咖啡图案生成方法及系统

图案生成方法饮品制作图像生成模型拉花语义实体

一种AI智能体分发与权限控制方法及系统

权限控制方法意图自然语言摘要动态

SaaS模式下民航业智能问答平台、存储介质和设备

智能问答平台 AI开放平台工作模块数据存储模块开放接口调用

多模态序列数据处理方法、装置、设备及介质

序列数据处理方法层级动作传感器多尺度特征金字塔融合特征

一种工业产业数据图谱智能生成方法及系统

智能生成方法报告权限管理模块数据抓取技术智能生成系统

多模态自然语言理解与生成系统及方法

站点导航

APP 下载