摘要
本申请提出一种基于低碳能源文本的自动化大语言模型微调样本生成方法,其中,方法包括:获取可移植文件格式的低碳能源文本;对所述可移植文件格式的低碳能源文本进行格式转换,获取MD格式的低碳能源文本;将所述MD格式的文本输入至初始基座大语言模型进行清洗,获取清洗后的训练文本;对所述清洗后的训练文本进样本划分,获取划分文本集合,并将所述划分文本集合添加至训练样本集合;采用所述训练样本集合对所述初始基座大语言模型进行训练,获取目的基座大语言模型,解决现有技术中由于训练样本的缺乏使得基座大语言模型的获取准确性较差的技术问题。
技术关键词
文本
大语言模型
计算机执行指令
样本生成方法
能源
基座
语义识别技术
格式转换器
光学字符识别
可读存储介质
处理器通信
存储器
生成装置
服务器
系统为您推荐了相关专利信息
调节压缩机
空调器
压缩机频率控制
温度预测模型
优化压缩机