摘要
本申请提供一种图文校对方法、装置、设备及可读存储介质。该方法包括:获取待校对图像;确定所述待校对图像对应的文本内容;获取所述文本内容的外部补充信息;确定所述待校对图像、所述文本内容和所述外部补充信息对应的待校对信息;将所述待校对信息输入多模态大语言模型,获取图文校对结果;通过获取待校对图像和待校对图像对应的文本内容,可同时得到待校对图像和文本内容,提高了后续图文校对的信息丰富度,以及通过获取所述文本内容对应的外部补充信息,可利用大量的外部知识来补充模型本身的知识库,进而生成更加准确和具体的文本,结合待校对图像和文本内容,极大提高了图文校对的准确性。
技术关键词
校对方法
文本
图文
大语言模型
多模态
校对装置
图像获取模块
检测器
电子设备
可读存储介质
实体
存储器
处理器
计算机
系统为您推荐了相关专利信息
知识库生成方法
样本
机器学习模型训练
文本
存储器
智能拐杖控制方法
吃药提醒
远程控制智能家居设备
智能拐杖控制系统
姿态检测模块
肺动脉高压患者
慢性血栓栓塞性肺动脉高压
图像后处理分析
特发性肺动脉高压
血液系统疾病
决策模型训练方法
胎儿健康
医学
数据缺失值
阶段
机器人交互方法
大语言模型
语义向量
记忆
关键词