摘要
本发明公开了一种基于多特征融合的语义检索方法,基于人工智能和大模型技术,首先利用词频和反文档频率对jieba模型分词后的词语进行清洗,提高语义搜索效率,然后结合BERT模型、长短时记忆网络和条件随机场模型对用户搜索语句和目标文本中的词语进行实体识别,最后从关键词、词形、词序和词向量四个特征维度进行文本的相似性计算,并返回相似度大于阈值的文本,提高语义搜索的准确率。
技术关键词
文本
词语
语义检索方法
关键词
条件随机场模型
BERT模型
大规模语料库
命名实体识别
频率
分词
语句
网络
关系
鲁棒性
答案
字符
形态
标签
系统为您推荐了相关专利信息
数据处理方法
多模态
数据处理装置
非临时性计算机可读存储介质
执行器
响应优化方法
大语言模型
数据
干预技术
心理危机干预
电力设备温度
可见光图像
红外图像特征
监控方法
融合图像信息
预训练语言模型
大语言模型
微调方法
非暂时性机器可读存储介质
计算机程序指令