融合图表关键数据的多模态图表到文本生成方法与系统

正文

推荐专利

申请号：CN202411648793

申请日期：2024-11-19

公开号：CN119150826B

公开日期：2025-03-18

类型：发明专利

摘要

本发明提出一种融合图表关键数据的多模态图表到文本生成方法与系统，该方法通过提取图表中的关键数据和视觉特征，再利用多模态注意力网络和门融合机制对两种模态的特征进行融合，以充分学习图表的关键语义特征和全局视觉特征，最后对融合后的特征进行解码并生成具有高流畅度和事实一致性的图表描述文本。本发明采用了大语言模型语义增强和多模态学习的方法，使模型能够对图表传达的语义进行更充分理解和学习。模型易于搭建，生成的文本流畅度高，包含的事实更多更准确，文本内容也更加精简。

技术关键词

图表文本生成方法表格融合特征数据训练语言模型文本编码器图像块大语言模型文本生成系统全局视觉特征多模态注意力多模态特征融合语义

系统为您推荐了相关专利信息

一种涂料用智能化色差分析检测方法

分析检测方法色差纹理特征基材分布直方图

面向应用镜像的资源使用量统计方法及系统

资源使用量镜像资源占用比例统计方法进程

一种数据缓存恢复的方法及系统

队列网络功能虚拟化系统虚拟网络功能环形线性

一种地铁路线规划装置及其规划方法

站点路径规划算法数据存储模块队列短距离

基于技术领域的金融科技专利分类方法

分类方法科技生物识别物联网数据分析区块链数据结构

融合图表关键数据的多模态图表到文本生成方法与系统

站点导航

APP 下载