文本数据的处理方法、装置及计算机设备

AITNT
正文
推荐专利
文本数据的处理方法、装置及计算机设备
申请号:CN202411506327
申请日期:2024-10-28
公开号:CN119474399A
公开日期:2025-02-18
类型:发明专利
摘要
本申请涉及一种文本数据的处理方法、装置、计算机设备、计算机可读存储介质,可用于金融领域中的数据处理。其中,该方法包括:获取与业务场景相关的非结构化文本数据并进行分词以确定实体对象和实体序列,再统计实体对象的频率值,根据预设频率阈值对实体序列中的实体对象进行过滤,过滤后得到初始序列,构建实体对象对应的特征向量并输入预设提取模型可以得到实体关系,再根据实体对象和实体关系可以生成对应的知识图谱。这样,通过对业务场景相关的文本数据进行处理可以得到该业务场景下的知识图谱,简化了业务场景的数据量,保留了文本数据中更有价值的信息,提高了文本数据的可利用性,降低了学习难度,提升了数据利用效率。
技术关键词
实体 非结构化文本 对象 序列 图谱 主题关键词 语法模型 场景 分词 计算机设备 关系 频率 可读存储介质 数据获取模块 计算机程序产品 处理器 节点 过滤模块
系统为您推荐了相关专利信息
1
基于OCR和大模型结构化PDF文件的方法
文本 大语言模型 节点特征 页面图片 多模态
2
基于SDTM标准的医学临床数据标准化转换方法和装置
文本生成模型 转换方法 医学 电子数据采集系统 变量
3
图像检测方法、装置、计算机设备、存储介质和程序产品
高频特征 融合特征 状态空间模型 频域特征 图像检测方法
4
一种基于区块链技术的物流溯源系统及方法
物流溯源方法 区块链技术 数据存储路径 信息熵 物流溯源系统
5
一种基于目标检测和语言特征的音符级自动歌唱转录方法
转录方法 切片 音频 序列 决策
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号