摘要
本申请提供一种文档数据处理方法、装置、设备及介质,涉及人工智能技术领域。该方法包括:获取预建向量库和待审核文档;根据待审核文档和预设拆分规则进行文档拆分处理;根据各待审核片段在预建向量库中进行搜索处理;响应于用户审核调整操作对第一参考文档名称列表进行调整;根据第二参考文档名称列表,确定各待审核片段的参考来源知识,并对各待审核片段的参考来源知识进行知识点范围调整处理;将各待审核片段的目标参考来源知识、各待审核片段和固定提示词输入预训练知识检索大模型;响应于用户对各待审核片段的审核结果的结果处理操作,得到目标审核结果。本申请的方法,提高了审核准确性和效率,降低了文档内容审核过程中的人力投入。
技术关键词
文档数据处理方法
拆分规则
计算机执行指令
列表
文档数据处理装置
样本
知识点
目录
可读存储介质
人工智能技术
搜索模块
处理器通信
滑动窗口
存储器
输出模块
电子设备
系统为您推荐了相关专利信息
策略
数字签名验证
零知识证明
指标
建立数据传输通道
智能网联汽车数据
时延
格式数据流
时间差
车载终端
服务系统
主控芯片
服务器
数据
计算机可执行指令
NLP技术
修正错别字
语义
BERT模型
命名实体识别