摘要
本发明提供了文本识别技术领域的一种基于视觉语言大模型的文本审查方法及系统,方法包括:步骤S1、获取大量的历史文本文件构建数据集,将数据集划分为训练集和验证集;步骤S2、基于VARY‑TINY模块、VARY‑BASE模块创建视觉语言大模型,设定视觉语言大模型的超参数、损失优化器、余弦退火调度器;步骤S3、通过训练集对视觉语言大模型进行训练,通过验证集对训练后的视觉语言大模型进行验证;步骤S4、将视觉语言大模型部署在服务器;步骤S5、服务器获取待审查文本文件、审查信息,将待审查文本文件输入视觉语言大模型获取文本识别内容,通过审查信息对文本识别内容进行匹配,生成文本审查结果。本发明的优点在于:极大的提升了文本审查的准确率以及泛化能力。
技术关键词
视觉词汇表
图像编码器
身份验证机制
积层
服务器
优化器
模型训练模块
超参数
格式
调度器
数据
文本识别技术
批量
字典
软件包
系统为您推荐了相关专利信息
人工智能算法
处理单元
时间段
自动化方法
远程服务器
卷积神经网络模型
模糊算子
滤波器
反射率
编码器
超声心动图
分割模型训练方法
图像编码器
心脏
生成训练数据
图像分类模型
智能诊断方法
客户端
宫颈
结构纹理特征