摘要
本申请涉及一种文档语义风险识别方法、装置、计算机设备和存储介质。所述方法包括:获取待识别文档的多个文档分块的分块特征向量;对各文档分块进行表达式构建,得到目标语义算子表达式;根据语言转换模型对目标语义算子表达式进行转换,获得目标表述文本;语言转换模型用于将抽象概念转换为具体文本;根据预训练语言模型、各分块特征向量和目标表述文本进行匹配,从多个文档分块中确定目标文档分块;对目标文档分块进行分析,得到文档语义风险分析结果。采用本方法通过对待识别文档进行分块,并对其进行处理,能够精准地从多个文档分块中提取出关键内容,进而能够更加精准地识别潜在的语义风险。
技术关键词
预训练语言模型
分块
表达式
语义
风险识别方法
文本
计算机设备
风险识别装置
计算机程序产品
处理器
关系
匹配模块
分析模块
可读存储介质
存储器
系统为您推荐了相关专利信息
知识图谱模型
样本
实体
非暂态计算机可读存储介质
关系
大语言模型
决策优化方法
动态修正结构
策略
融合语义
数据检索方法
自然语言
语句
生成结构化数据
排序模型
Louvain算法
方剂
定量方法
核心
多靶点调控
事件要素抽取方法
复杂度
深度学习模型
语法特征
句法结构