一种基于LLM的科学文献主题发现方法及装置

AITNT
正文
推荐专利
一种基于LLM的科学文献主题发现方法及装置
申请号:CN202510700185
申请日期:2025-05-28
公开号:CN120780837A
公开日期:2025-10-14
类型:发明专利
摘要
本发明公开了一种基于LLM的科学文献主题发现方法及装置。本方法为:1)获取每一科学文献样本的文本表征并利用文本编码器对其进行编码,得到对应科学文献样本的文档表征矩阵;2)对各科学文献样本进行聚类,得到不同主题的聚类结果;计算每个科学文献样本的熵值,选取高不确定性样本;3)计算每一高不确定性样本与其他科学文献样本之间的语义相似性,构建多个三元组任务;利用各三元组任务通过对比学习方法微调文本编码器;4)使用文本编码器对每一科学文献样本的文本表征进行编码,得到对应科学文献样本的文档表征矩阵;5)利用各科学文献样本的文档表征矩阵对各科学文献样本进行主题聚类,生成各科学文献样本的聚类标签和主题划分结果。
技术关键词
样本 文本编码器 主题发现方法 三元组 学习方法 矩阵 主题语义 聚类方法 采样模块 无监督 摘要 存储计算机程序 论文 标签
系统为您推荐了相关专利信息
1
一种中间体合成用的供料系统及供料方法
供料方法 氧化剂 催化剂 自由基 智能调控
2
一种自动驾驶算法优化方法及装置、计算机程序产品
算法优化方法 自动驾驶系统 人类驾驶员 计算机程序指令 计算机程序产品
3
模型训练方法、推荐方法及相关设备
编码特征 模型训练方法 数据 对象 推荐方法
4
一种基于降阶模型的刚弹模态相关性分析方法
耦合动力学模型 相关性分析方法 降阶模型 气动力 非线性方法
5
医学推理大模型构建方法、装置、电子设备及存储介质
医学 模型构建方法 推理规则 患者 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号