基于低碳能源文本的自动化大语言模型微调样本生成方法

正文

推荐专利

申请号：CN202510778412

申请日期：2025-06-11

公开号：CN120633714A

公开日期：2025-09-12

类型：发明专利

摘要

本申请提出一种基于低碳能源文本的自动化大语言模型微调样本生成方法，其中，方法包括：获取可移植文件格式的低碳能源文本；对所述可移植文件格式的低碳能源文本进行格式转换，获取MD格式的低碳能源文本；将所述MD格式的文本输入至初始基座大语言模型进行清洗，获取清洗后的训练文本；对所述清洗后的训练文本进样本划分，获取划分文本集合，并将所述划分文本集合添加至训练样本集合；采用所述训练样本集合对所述初始基座大语言模型进行训练，获取目的基座大语言模型，解决现有技术中由于训练样本的缺乏使得基座大语言模型的获取准确性较差的技术问题。

技术关键词

文本大语言模型计算机执行指令样本生成方法能源基座语义识别技术格式转换器光学字符识别可读存储介质处理器通信存储器生成装置服务器

系统为您推荐了相关专利信息

空调器的压缩机频率控制方法、装置及空调系统

调节压缩机空调器压缩机频率控制温度预测模型优化压缩机

训练样本选取方法、装置、电子设备及存储介质

语义特征文本风格聚类算法电子设备

一种基于知识图谱的大语言模型知识增强方法与系统

实体大语言模型图谱文本多层感知机层

一种基于偏好优化的音频生成方法

音频生成方法音频特征预训练模型文本解码器

内容提取方法、系统、设备、存储介质及程序产品

图像文本对象条目内容提取方法

基于低碳能源文本的自动化大语言模型微调样本生成方法

站点导航

APP 下载