一种大语言模型的Token级接受-拒绝对齐方法

正文

推荐专利

申请号：CN202510861689

申请日期：2025-06-25

公开号：CN120725003A

公开日期：2025-09-30

类型：发明专利

摘要

本发明提供了一种大语言模型的Token级接受‑拒绝对齐方法，可以应用于自然语言处理技术领域。该方法包括：基于文本训练数据，利用目标大语言模型生成的候选Token集，并对候选Token集进行多策略采样，得到候选Token有序集；将Token筛选过程建模成马尔可夫决策过程，通过轻量化对齐模型计算候选Token有序集中的每个Token的接收‑拒绝概率进而实现对候选Token有序集进行筛选，得到Token筛选集；利用Token筛选集对所述目标大语言模型生成的候选文本序列进行筛选以便将句子级对齐任务分解为Token级二元分类任务，得到与文本训练数据相对应的目标文本样本。

技术关键词

大语言模型对齐方法多策略决策文本生成模型序列数据标签网络优化模型更新自然语言图像样本阶段蒸馏动态

系统为您推荐了相关专利信息

一种基于改进登山算法的多态系统选择性维修决策方法

多态系统维修决策方法元件模拟退火算法搜索算法

一种基于分层深度强化学习的多机空战协同方法

环境感知信息深度强化学习飞行器协同方法飞行状态数据

一种IP地址的别名前缀检测方法和装置

中转设备节点逻辑回归算法网络探测技术表达式

一种采用神经网络特征匹配的医疗图像相似性检测方法及电子设备、计算机可读存储介质和计算机软件产品

图像相似性检测方法计算机软件产品神经网络特征卷积神经网络模型

一种针对大模型的自适应检索增强问答系统及其问答方法

问答方法专业知识库大语言模型问答系统数据

一种大语言模型的Token级接受-拒绝对齐方法

站点导航

APP 下载