摘要
本发明涉及基于知识图谱的风险画像生成技术领域,且公开了一种基于知识图谱的风险画像生成方法。本方案通过句末符分割文档,确保语义连贯,提高候选词提取的准确性与稳定性。采用连续汉字序列切分,避免分词工具依赖,并记录候选词的出现频次及位置,为风险因子筛选提供翔实的统计依据。设定最小出现次数常数,平衡噪声干扰与信息覆盖,提升筛选灵活性,使候选词筛选更具代表性。统计句子内候选词的共现关系,并通过指示函数量化共现次数,增强词语关联表达,为初始图谱构建提供关键数据。最终,方案基于候选词及其共现关系构造知识图谱,确保风险信息表达清晰,提高系统在风险识别与画像生成中的准确性。
技术关键词
画像生成方法
图谱
风险
节点
文本
汉字
因子
联结结构
生成技术
索引
序列
语义
符号
数据
词语
分词
关系
实体
噪声
系统为您推荐了相关专利信息
导引设备
路径规划方法
多AGV系统
路径规划装置
路径规划算法
实体识别模型
三元组
知识图谱构建方法
深度学习模型
结构化数据格式