摘要
本发明涉及一种大语言模型驱动的主题导向型多文档摘要生成方法,属于自然语言处理技术领域。该方法包括:执行多文档数据预处理;应用大语言模型为每个预处理后的单文档生成简洁的摘要及识别主题;将文档的摘要与主题转换成向量表示,并通过聚类算法形成基于内容相似性的多个类别;针对每个类别内的文档使用大语言模型生成综合性的摘要;融合所有类别的综合性摘要,再次利用大语言模型生成最终摘要。本发明通过分阶段处理和主题向量注入,解决了传统方法在处理海量文档时遇到的输入长度限制和缺乏主题连贯性的问题,提升了摘要的准确性和聚焦度。
技术关键词
文档摘要生成方法
大语言模型
综合性
聚类算法
文本
高维特征向量
识别主题
注意力机制
自然语言
分阶段
元素
语义
冗余
格式
数据
系统为您推荐了相关专利信息
电力系统负荷预测方法
预测误差
嵌入特征
集成策略
电力系统负荷预测技术
编程
答题
知识点标签
推荐方法
sigmoid函数
文本分类方法
神经网络模型
文本编码器
标签结构
文本分类模型
道地药材
在线获取方法
启发式规则
大语言模型
机器翻译系统