摘要
本发明公开了一种基于多模态信息的论文排序方法、系统、电子设备、介质,所述方法包括:将待处理的论文PDF文档按页拆分,并将每页保存为图像数据;对每页对应的图像数据进行处理,得到每一版面区域类别以及对应的包围框坐标、文字字段;对每页中的包围框坐标进行归一化及偏移处理,对归一化及偏移处理后的包围框坐标按照从上到下、从左到右的顺序进行排序;设置无效版面区域类别,并删除,得到全文粗排序结果;设置提示词模板,将全文粗排序结果填入提示词模板后输入至大语言模型,得到全文精排序结果。
技术关键词
论文排序方法
多模态信息
坐标
模板
字段
图像
数据
页面宽度
页面高度
电子设备
排序系统
处理器
计算机程序产品
存储器
文章
识别模块
可读存储介质
系统为您推荐了相关专利信息
力跟踪控制系统
手术机器人
关节力矩传感器
递归最小二乘法
协方差矩阵
语义分割网络
空间结构关系
语义分割方法
番茄
长短期记忆模型
数据整合系统
洁净室专用
无尘室
天花板
洁净室工程
无人机飞行路径
多模态特征
三维环境模型
动态负载均衡机制
冲突检测机制