一种基于行业分类的相似语句检索方法及系统

AITNT
正文
推荐专利
一种基于行业分类的相似语句检索方法及系统
申请号:CN202411035060
申请日期:2024-07-30
公开号:CN119003561A
公开日期:2024-11-22
类型:发明专利
摘要
本发明涉及数据处理领域,具体来说是一种基于行业分类的相似语句检索方法及系统,所述方法包括:S1.查询数据库构建:在构建查询数据库时,先采用一种基于互信息算法,对现有语料进行业务分类,然后使用预训练的模型对语料进行向量化,将业务分类标签和向量化数据一同存储至数据库;S2.相似语句检索:在相似语句检索时,先将目标语句通过分词和分类特征矩阵进行运算,获得目标语句的分类标签,同时对目标语句进行向量化,然后通过分类标签筛选以及语句向量余弦值匹配最相似的结果。所述系统包括查询数据库构建模块和相似语句检索模块。本发明优点在于:在检索过程中融入业务属性,增强检索的针对性,提高检索结果的准确性。
技术关键词
语句 检索方法 关键词 分类特征 分词 矩阵 训练集数据 标签特征 检索系统 测试机 模块 算法 度量
系统为您推荐了相关专利信息
1
一种基于自然语言的三维模型智能生成方法及系统
自然语言 实体 停用词表 生成三维模型 三维模型智能
2
基于知识图谱的糖尿病干预智能推荐方法
智能推荐方法 策略 序列 细粒度特征 协方差矩阵
3
一种基于电子交易平台的评标方法、装置和介质
电子交易平台 项目 BERT模型 NLP技术 句法分析技术
4
基于情景学习的长文档多维度文本分类方法及系统
文本特征分析 文本分类方法 文本分类系统 摘要 模版
5
一种物联网设备分类方法、装置及电子设备
设备特征 分类特征 分类设备 分类方法 简化特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号