基于反馈及强化的模型微调方法及系统

AITNT
正文
推荐专利
基于反馈及强化的模型微调方法及系统
申请号:CN202511063207
申请日期:2025-07-31
公开号:CN120562523B
公开日期:2025-10-31
类型:发明专利
摘要
本申请提供了基于反馈及强化的模型微调方法及系统,涉及自然语言处理技术领域,方法包括:获取语言模型生成的输出文本并进行嵌入编码;识别文本中结构性语义单元,生成结构标记信息;基于结构标记信息构建低层胶囊集合,执行动态路由生成高层语义胶囊集合;依据高层语义胶囊集合与结构标记的映射关系构建结构表达矩阵;将该矩阵输入奖励评分模型生成强化学习回报值,并据此更新语言模型参数。该方法实现了语言模型结构感知能力与策略优化路径的闭环联动,可在无需人工标注的条件下提升文本生成结构性与语义一致性。
技术关键词
语义 胶囊 微调方法 文本 矩阵 强化学习策略 网络模块 序列 策略更新 动态 指标 锚点 微调系统 编码 生成结构 关系 标记单元 分子 通道
系统为您推荐了相关专利信息
1
雷电附着点仿真与试验结果多维相似性统计评估方法
统计评估方法 协方差矩阵 仿真模型 对象 协方差估计
2
电网电力负荷预测方法、装置和电子设备
方差贡献率 RNN模型 隐马尔可夫模型 特征值 成分分析
3
一种电池管理方法和车辆
电池管理方法 电池健康状态 采样率 二值化神经网络 边缘控制器
4
基于压缩采样重构特征的调制模式识别方法
调制模式识别方法 偏最小二乘回归算法 频谱特征 矩阵 非线性
5
一种基于同态评价的鲁棒隐私联邦学习方法
联邦学习方法 信誉值 加密 服务器 概率密度函数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号