摘要
本发明涉及数据处理领域,具体来说是一种基于行业分类的相似语句检索方法及系统,所述方法包括:S1.查询数据库构建:在构建查询数据库时,先采用一种基于互信息算法,对现有语料进行业务分类,然后使用预训练的模型对语料进行向量化,将业务分类标签和向量化数据一同存储至数据库;S2.相似语句检索:在相似语句检索时,先将目标语句通过分词和分类特征矩阵进行运算,获得目标语句的分类标签,同时对目标语句进行向量化,然后通过分类标签筛选以及语句向量余弦值匹配最相似的结果。所述系统包括查询数据库构建模块和相似语句检索模块。本发明优点在于:在检索过程中融入业务属性,增强检索的针对性,提高检索结果的准确性。
技术关键词
语句
检索方法
关键词
分类特征
分词
矩阵
训练集数据
标签特征
检索系统
测试机
模块
算法
度量
系统为您推荐了相关专利信息
自然语言
实体
停用词表
生成三维模型
三维模型智能
电子交易平台
项目
BERT模型
NLP技术
句法分析技术
文本特征分析
文本分类方法
文本分类系统
摘要
模版