摘要
本发明公开了一种基于大语言模型的通用个性化生成方法。1)将需要学习的个性化文本数据输入大语言模型的嵌入层得到文本嵌入;2)基于步骤1)的文本嵌入与一组可学习个性化表示与进行拼接得到个性化嵌入;3)基于大语言模型LLM构建个性化生成模型结构,个性化生成模型结构包括LLM层和基于风格适配器的输出层;4)对个性化生成模型进行训练;5)使用步骤4)训练好的个性化生成模型,基于输入文本,续写生成与训练数据风格一致的个性化文本。本发明提供了一种基于大语言模型的通用个性化生成方法。本发明的目的在于设计了一种利用可学习个性化表示的风格适配器,与原有大语言模型的输出层协作,输出与训练数据风格一致的个性化文本。
技术关键词
个性化生成方法
大语言模型
文本
风格
生成程序
动态门控
适配器
Softmax函数
误差反向传播
可读存储介质
参数
神经网络模型
数据处理模块
处理器
解码
生成装置
分词
自然语言
存储器
系统为您推荐了相关专利信息
对象
页面展示数据
信息推送方法
计算机执行指令
人工智能技术
运维
信息反馈方法
语音输入信息
多模态
信息检索