一种大语言模型的微调方法、直播处理方法、装置和设备

正文

推荐专利

申请号：CN202410781653

申请日期：2024-06-17

公开号：CN118555414A

公开日期：2024-08-27

类型：发明专利

摘要

本公开提供了一种大语言模型的微调方法、直播处理方法、装置和设备，涉及深度学习、自然语言处理等技术领域，可应用于直播场景。该微调方法包括：根据直播间的第一样本事件集和预设的决策提示词生成决策提示语句；将所述决策提示语句输入第一大语言模型，通过所述第一大语言模型确定第一决策类型，并通过所述第一大语言模型根据所述第一决策类型和所述第一样本事件集预测直播间的第一直播内容；执行所述第一直播内容，并根据所述直播间在执行所述第一直播内容之后的用户行为数据确定所述第一直播内容的第一奖励值；根据所述第一奖励值，对所述第一大语言模型进行微调得到经微调的第二大语言模型，用于确定直播间的目标直播内容。

技术关键词

大语言模型决策语句样本子模块意图直播工具微调方法强化学习模型编辑基础数据指令执行单元处理器在线计算机程序产品微调装置

系统为您推荐了相关专利信息

一种零配置的自适应说话人识别方法及系统

说话人身份单人说话人识别方法语音活动检测标签

一种基于云边协同的缺陷检测系统及方法

缺陷检测系统云端样本缺陷类别缺陷检测方法

基于动态拓扑结构的大规模社交网络模拟方法和系统

网络模拟方法动态拓扑结构动态演化过程核心链接预测方法

一种产品推荐的方法和装置

样本数据序列模型训练模块标签

资源数据精准匹配系统

模型训练模块决策树模型数据分析模块两点间距离数据处理模块

一种大语言模型的微调方法、直播处理方法、装置和设备

站点导航

APP 下载