摘要
本发明提供一种基于大语言模型的创新自动化文献主题词提取方法,涉及自然语言处理和信息检索技术领域,包括S1数据采集、S2数据预处理、S3少样本学习与主题词列表提取、S4主题词列表排序、S5迭代优化、S6主题词筛选,通过利用大语言模型处理和生成主题词列表,相比于使用BERTopic,可以更高效地一次性处理和分析大规模文献集合,能有效管理和分析庞大的数据集,通过持续迭代和优化过程,能够保存每篇文献生成的主题词,这些主题词相比于传统的LDA方法更为精确。这不仅有助于确保研究的连贯性和深度,也为后续研究提供了可靠的基础,直接利用预训练的大型语言模型进行文献的语义解析和主题词生成,省去了繁琐的模型训练过程。
技术关键词
主题词提取方法
大语言模型
列表
信息检索技术
可视化方法
存储平台
排序算法
哈希算法
数据
自然语言
样本
语义
在线
基础
系统为您推荐了相关专利信息
缺陷检查方法
抽象语法树
形式化验证方法
求解算法
规划
工程设计图纸
变电站设备
元素
识别方法
设备识别