一种基于Seq2Seq和DBSCAN的古诗词语义检索方法

AITNT
正文
推荐专利
一种基于Seq2Seq和DBSCAN的古诗词语义检索方法
申请号:CN202510255361
申请日期:2025-03-05
公开号:CN120371986A
公开日期:2025-07-25
类型:发明专利
摘要
本发明公开了一种基于Seq2Seq和DBSCAN的古诗词语义检索方法,基于Seq2Seq模型和LSTM网络,将古诗文序列生成白话文文本;然后基于预构建词典,通过逆向最大匹配算法切分翻译后的文本,构建古诗词语义特征向量库。接着基于用户输入的白话文查询,生成查询语句的语义特征向量,采用基于N‑Gram和动态滑动窗口的余弦相似度算法,提取查询语句和古诗词语义特征中的连续词组,计算相似度,检索出与用户查询最相近的古诗词,最后利用DBSCAN算法对语义特征向量进行聚类分析,扩展推荐相似古诗词。本发明解决了传统关键词匹配方法无法准确理解诗词深层语义的问题,能够实现高效且精准的个性化推荐,提高了检索效率。
技术关键词
语义检索方法 动态滑动窗口 Word2Vec模型 语句 特征向量库 语义向量 文本 DBSCAN算法 分词 情感反馈 构建词典 关键词匹配方法 语义匹配算法 数据清洗算法 序列 聚类分析算法 采集系统 语义特征 训练语料库
系统为您推荐了相关专利信息
1
检索增强生成方法、系统、设备及介质和问答方法及系统
语义向量 切片 样本 生成方法 语句
2
跨平台内核适配方法
内核 Word2Vec模型 接口 参数传递方式 Hook技术
3
基于大语言模型生成思维链解释进行训练的事件抽取方法
事件抽取方法 大语言模型 事件抽取技术 生成事件 学习方法
4
一种大模型的安全性测评方法、装置及设备
样本 安全性测评方法 数据 自然语言 标签
5
一种基于大语言模型的经验学习自适应预瞄控制方法
大语言模型 货架托盘 记忆 轨迹 场景
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号