摘要
本申请揭示一种主体名称分类及其模型训练方法、计算机设备及存储介质,该方法包括:对多类原始主体名称数据进行抽样,得到主体名称样本数据集;对主体名称样本数据集进行数据清洗,得到主体名称标准数据集;对主体名称标准数据集进行分词处理,得到初始主体名称词汇列表;对初始主体名称词汇列表进行交叉关键词剔除处理,得到目标主体名称词汇列表;提取目标主体名称词汇列表中每个目标主体名称词汇的嵌入特征,得到嵌入特征集;以预设的集成模型框架,基于嵌入特征集进行训练,得到主体名称分类模型,能够有效提升主体名称分类模型的准确性,从而有利于在风险管理、合规管理、展业获客、数据治理等方面进行数据管理和分析。
技术关键词
分类模型训练方法
嵌入特征
列表
关键词
有向无环图
样本
分类方法
计算机设备
动态规划算法
网络结构
构建词典
游走模型
可读存储介质
分词
训练集
处理器
数据管理
图谱
系统为您推荐了相关专利信息
关系型数据库
梯度提升决策树算法
推送系统
知识推荐算法
内容推荐算法
关系型数据库
字段
结构化查询语言
大语言模型
文本
火灾报警系统
多通道传感器数据
模糊C均值聚类算法
模糊集合理论
场景