摘要
本发明提供一种用于复杂图文混合文件的方案检测方法及装置,方法包括:提取标准手册中的标准审查条目和标准审查内容并进行结构化处理,获得标准审查文件;将待检测的文件转换为待检测图像,采用OCR、预先训练获得的初始识别模型和匹配模型对待检测图像提取待审查的多尺度候选区域图像,并提取多尺度候选图像的文字信息,获得候选区域文字信息;将多尺度候选区域图像和标准审查文件输入至预先训练获得的轻量级混合孪生网络进行图像特征匹配,输出匹配特征图像;将匹配特征图像、标准审查文件以及候选区域文字信息输入至预先训练获得的多模态大模型进行合规分析,输出检测结果;该方法能够显著提升复杂图文混合文件的审查的自动化与智能化程度。
技术关键词
样本
图像
图文
网络模块
条目
特征提取模块
手册
投影模块
多尺度特征提取
数据
滑动窗口
输出模块
三元组
多模态
匹配模块
参数
图片
系统为您推荐了相关专利信息
硬件运行状态
融合网关
聚焦特征
语义特征
嵌入特征
车辆查询方法
强化学习模型
过滤器
图像匹配
数据
小规模
多层感知器
样本
医疗影像数据
人工智能模型训练
图像处理芯片
图像采集单元
输入接口
图像采集设备供电
数据