一种文本生成模型的构建方法

AITNT
正文
推荐专利
一种文本生成模型的构建方法
申请号:CN202411031316
申请日期:2024-07-30
公开号:CN118551741B
公开日期:2024-10-15
类型:发明专利
摘要
本发明提供一种文本生成模型的构建方法,涉及人工智能技术领域。所述方法包括:获取指定文本生成模型中每个FFN层对应的模型参数;获取FFN层中的神经元在变换处理中的激活特征,即共同激活矩阵、激活次数向量以及激活数量列表;基于FFN层对应的共同激活矩阵以及激活次数向量,将FFN层中的神经元按照拆分数划分为多个目标神经元组;针对预设数量个专家,基于多个目标神经元组从模型参数中提取每个专家对应的目标模型参数;利用所有激活数量列表以及目标模型参数,构建目标文本生成模型。本发明利用指定文本生成模型中的先验知识,可快速合理地配置目标文本生成模型的参数,进而可实现目标文本生成模型的快速部署,提升文本生成效率。
技术关键词
索引 列表 文本生成模型 矩阵 字典 元素 参数 前馈神经网络 副本 关系 人工智能技术
系统为您推荐了相关专利信息
1
基于类别指导的全视野切片图像的多级多标签分类方法、系统、电子设备
多标签分类方法 视觉特征 视野 切片 转移概率矩阵
2
基于多级协同融合增强网络的药物-靶标相互作用预测方法
靶标相互作用 药物 特征提取模块 注意力机制 交互特征
3
基于外逼近闵可夫斯基和的大规模变频空调精确聚合方法
虚拟电池模型 充放电功率 舒适度模型 集群 冗余
4
一种接口修复方法、设备、存储介质及程序产品
实体间关系 语义向量 接口 序列 语义功能
5
一种用于水库EPC项目不同阶段目标偏差动态识别方法
动态识别方法 阶段 多元回归模型 节点 偏差
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号