一种基于大语言模型的创新自动化文献主题词提取方法

正文

推荐专利

申请号：CN202510088121

申请日期：2025-01-21

公开号：CN120068864A

公开日期：2025-05-30

类型：发明专利

摘要

本发明提供一种基于大语言模型的创新自动化文献主题词提取方法，涉及自然语言处理和信息检索技术领域，包括S1数据采集、S2数据预处理、S3少样本学习与主题词列表提取、S4主题词列表排序、S5迭代优化、S6主题词筛选，通过利用大语言模型处理和生成主题词列表，相比于使用BERTopic，可以更高效地一次性处理和分析大规模文献集合，能有效管理和分析庞大的数据集，通过持续迭代和优化过程，能够保存每篇文献生成的主题词，这些主题词相比于传统的LDA方法更为精确。这不仅有助于确保研究的连贯性和深度，也为后续研究提供了可靠的基础，直接利用预训练的大型语言模型进行文献的语义解析和主题词生成，省去了繁琐的模型训练过程。

技术关键词

主题词提取方法大语言模型列表信息检索技术可视化方法存储平台排序算法哈希算法数据自然语言样本语义在线基础

系统为您推荐了相关专利信息

煤层三维应力预测及可视化方法、系统、设备及介质

应力可视化方法分数阶网格模型检测点

一种基于形式化验证的FPGA缺陷检查方法

缺陷检查方法抽象语法树形式化验证方法求解算法规划

一种基于工程设计图纸的变电站设备识别方法及系统

工程设计图纸变电站设备元素识别方法设备识别

一种用于苹果应用商店审核的预审核方法、系统及设备

风险资源核方法特征值视频图像识别模型

基于大语言模型的推理方法、装置、电子设备及存储介质

键值移动终端云端大语言模型推理方法

一种基于大语言模型的创新自动化文献主题词提取方法

站点导航

APP 下载