摘要
本发明公开了一种基于Seq2Seq和DBSCAN的古诗词语义检索方法,基于Seq2Seq模型和LSTM网络,将古诗文序列生成白话文文本;然后基于预构建词典,通过逆向最大匹配算法切分翻译后的文本,构建古诗词语义特征向量库。接着基于用户输入的白话文查询,生成查询语句的语义特征向量,采用基于N‑Gram和动态滑动窗口的余弦相似度算法,提取查询语句和古诗词语义特征中的连续词组,计算相似度,检索出与用户查询最相近的古诗词,最后利用DBSCAN算法对语义特征向量进行聚类分析,扩展推荐相似古诗词。本发明解决了传统关键词匹配方法无法准确理解诗词深层语义的问题,能够实现高效且精准的个性化推荐,提高了检索效率。
技术关键词
语义检索方法
动态滑动窗口
Word2Vec模型
语句
特征向量库
语义向量
文本
DBSCAN算法
分词
情感反馈
构建词典
关键词匹配方法
语义匹配算法
数据清洗算法
序列
聚类分析算法
采集系统
语义特征
训练语料库
系统为您推荐了相关专利信息
内核
Word2Vec模型
接口
参数传递方式
Hook技术
事件抽取方法
大语言模型
事件抽取技术
生成事件
学习方法