基于低碳能源文本的自动化大语言模型微调样本生成方法

AITNT
正文
推荐专利
基于低碳能源文本的自动化大语言模型微调样本生成方法
申请号:CN202510778412
申请日期:2025-06-11
公开号:CN120633714A
公开日期:2025-09-12
类型:发明专利
摘要
本申请提出一种基于低碳能源文本的自动化大语言模型微调样本生成方法,其中,方法包括:获取可移植文件格式的低碳能源文本;对所述可移植文件格式的低碳能源文本进行格式转换,获取MD格式的低碳能源文本;将所述MD格式的文本输入至初始基座大语言模型进行清洗,获取清洗后的训练文本;对所述清洗后的训练文本进样本划分,获取划分文本集合,并将所述划分文本集合添加至训练样本集合;采用所述训练样本集合对所述初始基座大语言模型进行训练,获取目的基座大语言模型,解决现有技术中由于训练样本的缺乏使得基座大语言模型的获取准确性较差的技术问题。
技术关键词
文本 大语言模型 计算机执行指令 样本生成方法 能源 基座 语义识别技术 格式转换器 光学字符识别 可读存储介质 处理器通信 存储器 生成装置 服务器
系统为您推荐了相关专利信息
1
空调器的压缩机频率控制方法、装置及空调系统
调节压缩机 空调器 压缩机频率控制 温度预测模型 优化压缩机
2
训练样本选取方法、装置、电子设备及存储介质
语义特征 文本 风格 聚类算法 电子设备
3
一种基于知识图谱的大语言模型知识增强方法与系统
实体 大语言模型 图谱 文本 多层感知机层
4
一种基于偏好优化的音频生成方法
音频生成方法 音频特征 预训练模型 文本 解码器
5
内容提取方法、系统、设备、存储介质及程序产品
图像 文本 对象 条目 内容提取方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号