摘要
本发明属于大模型文本检测技术领域,公开了一种基于大模型的出版物的文本检测方法及装置。具体包括:获取原始出版物数据;通过大模型对原始出版物数据进行标注,并对标注的数据进行清洗,得到第一数据集;通过人工标注方式对原始出版物数据进行标注,得到第二数据集;基于第一数据集和第二数据集所构建的训练集对出版物大模型进行训练;利用出版物大模型对待检测出版物进行文本正确性检测;基于文本正确性检测结果判断待检测出版物的文本正确性是否满足预设条件;并在文本正确性满足预设条件之后,对待检测出版物进行AI文本检测,以得到检测结果。通过上述方式,不仅能够提升文本检测的准确度,还能够进行AI文本检测,使得文本检测更加全面。
技术关键词
文本检测方法
输入模块
语句
数据
CRF模型
统计特征
错误特征
构建训练集
正确率
文本检测技术
词语
标签
纠错
主题
样本
编码
序列
系统为您推荐了相关专利信息
启停控制方法
充电线圈
多传感器融合
无线充电
激光雷达数据
计划生成系统
机组组合模型
经济调度模型
机组发电
开机方式
节点
深度强化学习
信息处理系统
浮动结构
子模块
配置计算方法
水资源利用效率
三维地形图
地面控制点
水量