大语言模型的训练方法、自然语言处理方法及装置

AITNT
正文
推荐专利
大语言模型的训练方法、自然语言处理方法及装置
申请号:CN202411853944
申请日期:2024-12-16
公开号:CN119884736A
公开日期:2025-04-25
类型:发明专利
摘要
本说明书提供一种大语言模型的训练方法、自然语言处理方法及装置。所述方法包括:利用大语言模型对文本数据进行自然语言处理,得到处理结果,大语言模型的参数包括第一参数和第二参数,文本数据包括文本、图像、视频、音频中的至少一个;根据处理结果,计算损失函数值;根据损失函数值,计算第一参数的第一梯度和第二参数的第二梯度;根据第一参数和第二参数,计算余弦函数值和正弦函数值;根据余弦函数值和第一梯度,调整第一参数的值,并根据正弦函数值和第二梯度,调整第二参数的值;返回利用大语言模型对文本数据进行自然语言处理,得到处理结果的操作,直到训练结束条件被满足。
技术关键词
大语言模型 自然语言 参数 文本 余弦函数值 计算机 可读存储介质 数据 模块 训练装置 处理器 音频 指令 开方 视频 电子设备 图像 存储器
系统为您推荐了相关专利信息
1
基于关键信息溯源的公共卫生信息真实性预测方法及装置
消息 轮廓图像 边缘检测算法 语义 文本
2
基于区块链智能合约的标后电子保函风控方法
区块链智能合约 风险 分布式一致性算法 分布式账本 事件特征
3
数据分析方法、装置、计算机设备、可读存储介质和程序产品
文本 数据分析方法 大语言模型 逻辑 语句
4
一种跨链交易攻击检测方法、模型训练方法及相关装置
攻击检测模型 攻击检测方法 模型训练方法 智能合约部署 语义结构
5
一种基于LSTM自编码器的耕地闲置识别方法
耕地 编码器 多光谱遥感图像 识别方法 遥感影像数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号