一种基于机器学习的数据分割方法及系统

AITNT
正文
推荐专利
一种基于机器学习的数据分割方法及系统
申请号:CN202511102039
申请日期:2025-08-07
公开号:CN121009890A
公开日期:2025-11-25
类型:发明专利
摘要
本发明提供了一种基于机器学习的数据分割方法及系统,包括:收集历史物料数据并进行标注,构建标注语料库,并对标注语料库进行处理并存储至Elasticsearch;输入目标描述,并基于Elasticsearch召回与目标描述同类别物料对应的字段短语集,且在字段短语集中遍历目标描述,匹配输出第一目标字段;采集目标描述中未匹配的剩余信息,并对剩余信息进行双向分词处理,获得最终分词;计算最终分词与字段短语集中的各字段短语的相似度,并将剩余信息分配至相似度最高的第二目标字段;对第一目标字段与第二目标字段进行冲突检测,并当通过冲突检测时,输出目标描述的结构化格式。有利于提高语义匹配准确率以及分词识别效率。
技术关键词
数据分割方法 语义向量 分词 字段 格式 建立倒排索引 关系 匹配模块 分割系统 编辑 输出模块 逻辑 序列 图谱 算法 企业
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号