一种基于Seq2Seq和DBSCAN的古诗词语义检索方法

正文

推荐专利

申请号：CN202510255361

申请日期：2025-03-05

公开号：CN120371986A

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种基于Seq2Seq和DBSCAN的古诗词语义检索方法，基于Seq2Seq模型和LSTM网络，将古诗文序列生成白话文文本；然后基于预构建词典，通过逆向最大匹配算法切分翻译后的文本，构建古诗词语义特征向量库。接着基于用户输入的白话文查询，生成查询语句的语义特征向量，采用基于N‑Gram和动态滑动窗口的余弦相似度算法，提取查询语句和古诗词语义特征中的连续词组，计算相似度，检索出与用户查询最相近的古诗词，最后利用DBSCAN算法对语义特征向量进行聚类分析，扩展推荐相似古诗词。本发明解决了传统关键词匹配方法无法准确理解诗词深层语义的问题，能够实现高效且精准的个性化推荐，提高了检索效率。

技术关键词

语义检索方法动态滑动窗口 Word2Vec模型语句特征向量库语义向量文本 DBSCAN算法分词情感反馈构建词典关键词匹配方法语义匹配算法数据清洗算法序列聚类分析算法采集系统语义特征训练语料库

系统为您推荐了相关专利信息

检索增强生成方法、系统、设备及介质和问答方法及系统

语义向量切片样本生成方法语句

跨平台内核适配方法

内核 Word2Vec模型接口参数传递方式 Hook技术

基于大语言模型生成思维链解释进行训练的事件抽取方法

事件抽取方法大语言模型事件抽取技术生成事件学习方法

一种大模型的安全性测评方法、装置及设备

样本安全性测评方法数据自然语言标签

一种基于大语言模型的经验学习自适应预瞄控制方法

大语言模型货架托盘记忆轨迹场景

一种基于Seq2Seq和DBSCAN的古诗词语义检索方法

站点导航

APP 下载