摘要
本申请涉及一种文本数据的处理方法、装置、计算机设备、计算机可读存储介质,可用于金融领域中的数据处理。其中,该方法包括:获取与业务场景相关的非结构化文本数据并进行分词以确定实体对象和实体序列,再统计实体对象的频率值,根据预设频率阈值对实体序列中的实体对象进行过滤,过滤后得到初始序列,构建实体对象对应的特征向量并输入预设提取模型可以得到实体关系,再根据实体对象和实体关系可以生成对应的知识图谱。这样,通过对业务场景相关的文本数据进行处理可以得到该业务场景下的知识图谱,简化了业务场景的数据量,保留了文本数据中更有价值的信息,提高了文本数据的可利用性,降低了学习难度,提升了数据利用效率。
技术关键词
实体
非结构化文本
对象
序列
图谱
主题关键词
语法模型
场景
分词
计算机设备
关系
频率
可读存储介质
数据获取模块
计算机程序产品
处理器
节点
过滤模块
系统为您推荐了相关专利信息
文本生成模型
转换方法
医学
电子数据采集系统
变量
高频特征
融合特征
状态空间模型
频域特征
图像检测方法
物流溯源方法
区块链技术
数据存储路径
信息熵
物流溯源系统