摘要
本发明公开了一种表格图像及表格LaTeX代码生成方法和装置,所述方法包括:确定表格维度参数,以生成对应表格维度的LaTeX表格创建代码;将LaTeX表格创建代码及数据所属领域填入提示词模板,将该提示词输入大语言模型,输出新的LaTeX表格创建代码;新的LaTeX表格创建代码中,原有代表各单元格内容的占位符将被替换为数据所属领域的表头或相应数据;所述新的LaTeX表格创建代码中,对其中的单元格进行随机合并,得到表格LaTeX代码;利用渲染工具生成表格LaTeX代码对应的表格图像。本发明结合了计算机视觉和大语言模型的各自优势,利用图像、文本等多种模态信息,实现了<表格图像,表格LaTeX代码>的大规模自动生成,对表格识别技术研究、文献数字化等领域具有重要意义。
技术关键词
代码生成方法
图像
代码生成装置
大语言模型
表格识别技术
数据
风格
文献数字化
识别算法
表头
生成表格
处理器
计算机视觉
参数
存储器
模板
代表
可读存储介质
程序
系统为您推荐了相关专利信息
分块策略
序列
滑动窗口
非暂态计算机可读存储介质
语义向量
维修备件
大语言模型
预测系统
语义向量
工单预处理
岩体结构面
数字图像识别技术
三维点云模型
光照
岩体边坡