针对目标场景的大模型预训练方法、装置、设备及介质

AITNT
正文
推荐专利
针对目标场景的大模型预训练方法、装置、设备及介质
申请号:CN202410948731
申请日期:2024-07-15
公开号:CN118840643A
公开日期:2024-10-25
类型:发明专利
摘要
本申请涉及大模型预训练技术领域,具体提供一种针对目标场景的大模型预训练方法、装置、设备及介质,旨在解决大模型预训练方法无法较好地满足特定场景需求的技术问题。为此目的,本申请获取通用训练数据以及目标场景训练数据,基于通用训练数据对大模型进行监督训练,学习通用特征;基于目标场景训练数据对监督训练后的大模型进行自监督训练,提高模型在目标场景下的偏向性;基于目标场景训练数据对自监督训练后的大模型进行弱监督训练,进一步提高大模型在目标场景下的语义能力。本申请解决了现有大模型预训练方法无法较好地满足特定场景需求的问题,通过结合多种训练方法,充分利用了不同方法的优势,达到了相互补充、相互促进的作用。
技术关键词
预训练方法 场景 多标签图像 文本 图像解码器 模型预训练 图像编码器 通用特征 数据获取模块 处理器通信 智能设备 可读存储介质 存储器 语义
系统为您推荐了相关专利信息
1
实时交互的语音克隆方法、装置、设备和介质
声纹特征 特征提取模型 克隆方法 音频放大器 意图
2
内容生成方法、装置、电子设备、存储介质及程序产品
内容生成方法 注意力 样本 机器可读存储介质 文本特征向量
3
资源池容量预测方法、装置和电子设备
容量预测模型 容量预测方法 时间段 序列 资源
4
一种基于大语言模型反馈的语言学习评估方法及系统
大语言模型 编码 子模块 文本 日志
5
一种智能合约代码重构方法、装置、设备及可读存储介质
智能合约代码 重构方法 大语言模型 生成智能合约 工作流
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号