摘要
本发明涉及人工智能技术领域,更具体地说,本发明涉及一种用于大语言模型的自动化深度思维模式选择训练方法,其特征在于;包括以下方法:扩展分词器词汇表,添加特殊标记<think>和</think>,用于标识深度思考模式的内容结构;设计对话模板,区分普通模式与深度思考模式的输入输出格式,其中深度思考模式包含<think>标记引导的推理过程;构建规模相同的普通模式与深度思考模式训练数据集,对模型进行联合训练,使其同时具备两种模式的响应能力。本发明通过添加特殊标记(<think>和</think>)及定制对话模板,实现普通模式与深度思考模式的语义区分,使模型能够根据需求精准切换响应策略。
技术关键词
大语言模型
模式
训练系统
标记
生成答案
语义结构
人工智能技术
模板
规模
标识
数据
格式
模块
策略
机制
动态
定义
样本