摘要
本申请公开了一种问答方法、问答大模型训练方法、相关设备及程序产品,本申请配置的问答大模型能够提取问题数据的中间隐层状态特征,基于此可以生成表征问题数据所适配的推理模式的模式信号,示例性的,对于简单问题可以生成短CoT推理模式,对于复杂问题可以生成长CoT推理模式,进而可以将中间隐层状态特征和生成的模式信号向后传递,供后续隐层推理生成问题数据的响应信息。提升了问答大模型的智能性和适应性,相比于固定推理模式的策略,本申请方法可以在保证推理准确性的同时,提高推理效率并优化资源利用。
技术关键词
模型训练方法
问答方法
模式识别
样本
信号
数据
标签
模块
申请方法
计算机程序产品
处理器
矩阵
可读存储介质
网络
存储器
参数
电子设备
策略
系统为您推荐了相关专利信息
信号
傅立叶
汽车加速度传感器
信息更新
测试平台
智能客服
物流
生成答案
大语言模型
数据处理模块
超分辨方法
远距离
稀疏重构算法
像素
sigmoid函数
因子
模型训练方法
超参数
多分支结构
模型训练装置