摘要
本发明涉及文档智能审校技术领域,具体为基于大模型的多模态数字出版智能审校系统及方法,系统包括:样本构建模块、多模分析模块、结构识别模块、术语校验模块、注释输出模块。本发明中,通过对文本中主谓宾组合关系的解析与词性、句式、语义结构联合筛选生成模型配置数据集,提升语义识别与结构判断的精准性,结合图像动作路径与文本行为对象的比对关系,识别语义偏移及图文表达分离的局部特征,基于语义偏移信息分析段落逻辑结构与主题衔接方式,有效揭示段落之间的内容错位与主题跳转问题,针对术语跨段落语境中搭配变化轨迹与词性接续波动进行识别,并从句群层级分析标签交叠与覆盖冗余情况,形成标签合并建议并构建批注结构记录。
技术关键词
段落结构
语义
术语
子模块
标签
多模态
错位
主题
图文
层级
关键词
校验模块
文本
标识
关系
输出模块
序列
识别模块
分析模块
跨度
系统为您推荐了相关专利信息
图像检索模型
图像检索方法
检索图像
样本
图像增强