基于大模型的文本生成方法和文本生成模型的训练方法

正文

推荐专利

申请号：CN202411045495

申请日期：2024-07-31

公开号：CN118940730A

公开日期：2024-11-12

类型：发明专利

摘要

本公开提供了一种基于大模型的文本生成方法和文本生成模型的训练方法、装置、设备、介质、程序产品，涉及人工智能技术领域，尤其涉及深度学习、自然语言处理和大模型等技术领域。文本生成方法的具体实现方案为：获取针对待处理文本的记忆状态；记忆状态是基于待处理文本的在前文本生成的；以待处理文本的嵌入特征作为初始隐藏状态，采用第一注意力机制对记忆状态和初始隐藏状态进行处理，得到更新后隐藏状态；以及基于更新后隐藏状态，生成针对待处理文本的在后文本。

技术关键词

记忆文本生成模型状态更新嵌入特征双向注意力机制编码文本生成方法序列子模块传播算法网络模型训练模块样本文本生成装置指令处理器人工智能技术

系统为您推荐了相关专利信息

时间序列数据生成方法、装置、设备及介质

数据生成方法序列长短期记忆网络变量数据生成装置

一种化妆品玻璃瓶表面打磨方法及系统

化妆品玻璃瓶打磨件动态控制参数超声空化效应表面打磨方法

一种基于深度学习的电池分析方法及装置

卷积神经网络模型长短期记忆网络核心故障类别分析方法

一种基于自适应低秩表示的时间序列预测方法

时间序列预测方法正交变换矩阵运动向量信息多模型协同

一种天基探测视角下的强机动红外弱小目标高精度连续跟踪方法

连续跟踪方法轨迹度量视角跟踪器

基于大模型的文本生成方法和文本生成模型的训练方法

站点导航

APP 下载