摘要
本申请提供一种结合关键词指导与大语言模型近端策略优化的关键句抽取方法,包括:构建关键词‑关键句对;利用联合匹配模型评估其相关度,生成奖励值;引入KL散度衡量训练模型与参考模型之间的差异,结合状态价值网络对当前状态的价值分数进行估计;通过近端策略优化指导模型,实现关键句的抽取。本申请实施例的方法,构建关键词‑关键句对,利用联合匹配模型评估其相关度,生成奖励值,引入KL散度衡量训练模型与参考模型之间的差异,结合状态价值网络对当前状态的价值分数进行估计,通过近端策略优化指导模型,实现关键句的抽取,在很大程度上解决了对标注数据依赖性强以及大语言模型训练成本高的问题,显著提升了关键句抽取的效果。
技术关键词
关键词
网络
BERT模型
时序
大语言模型
抽取装置
处理器
控制策略
误差
可读存储介质
文本
模块
存储器
定义
电子设备
比率
计算机
因子
程序
系统为您推荐了相关专利信息
农田环境
GRU模型
监测方法
模糊逻辑算法
数据采集频率
药材化学成分
调节剂
肠道菌群调节
集群
口服液体制剂
深度学习神经网络
肿瘤
数据分析模块
患者
数据采集模块
深度LSTM网络
工业控制系统
入侵检测模型
时序特征
入侵检测方法