一种支持流式输入的大语言模型构建方法及系统

AITNT
正文
推荐专利
一种支持流式输入的大语言模型构建方法及系统
申请号:CN202411447399
申请日期:2024-10-16
公开号:CN119398097A
公开日期:2025-02-07
类型:发明专利
摘要
本发明提供一种支持流式输入的大语言模型构建方法及系统,方法包括:收集、选择数据,并进行数据预处理,利用预训练模型为基础,通过在预训练模型上进行微调,训练优化流式输入、自回归输出方式的大语言模型;预先设定数据块的大小,将用户的输入数据进行分块,以流式的方式接受用户的输入数据;将拼接数据输入给大语言模型,基于大语言模型的当前的输入数据,根据大语言模型的输出,判断是否回复用户,采取对应的动作回复用户。本发明大语言模型的响应速度得到很大的提升,大语言模型支持以流式输入、并行输出的方式响应用户的输入数据指令,达到“边听边思考边输出”的效果,尤其是在用户指令较长的场景下优势更加明显,有效提升了用户体验。
技术关键词
大语言模型 语言模型构建方法 模型构建系统 预训练模型 神经网络架构 分块 强化学习算法 梯度下降优化算法 序列 数据格式 计算机设备 处理器 基础 数据模块 意图 指令 风格 场景 元素
系统为您推荐了相关专利信息
1
一种基于大语言模型和特征检测的智能运维系统和方法
智能运维系统 大语言模型 数据获取模块 运维知识库 输出模块
2
单元测试代码生成方法、装置、设备和存储介质
单元测试代码 大语言模型 数据 非暂时性机器可读存储介质 代码生成装置
3
文本处理方法、装置、电子设备以及存储介质
编辑 文本处理方法 大语言模型 字段 语义标签
4
基于用户实时数据的推荐内容生成方法、装置及存储介质
画像 大语言模型 列表 消息 样本
5
任务执行和模型训练方法、装置、设备和介质
投影特征 文本 多模态 音频编码 音频特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号