一种气象语料库构建方法、系统及相关装置

AITNT
正文
推荐专利
一种气象语料库构建方法、系统及相关装置
申请号:CN202510055895
申请日期:2025-01-14
公开号:CN119476448A
公开日期:2025-02-18
类型:发明专利
摘要
本发明公开了一种气象语料库构建方法、系统及相关装置,属于气象数据处理技术领域。该方法包括:收集气象领域的原始语料文件,将原始语料文件转换成统一的markdown格式数据;对所述markdown格式数据进行清洗,并组织成统一结构化的气象语料库;将所述统一结构化的气象语料库结合外部知识库构建气象服务大模型所需要的各类数据集,各类数据集包括用于预训练的数据集、微调的数据集以及检索增强生成所需的数据集和评估基准数据集。该方法显著提高了构建效率,降低了人工成本,同时也确保了气象语料库的质量和一致性。
技术关键词
语料库构建方法 面向气象服务 启发式规则 格式 气象数据处理技术 语料库构建系统 数据分析模块 指示计算机执行 分布式计算框架 计算机程序产品 构建知识图谱 可视化方法 基准 可读存储介质 大语言模型 组织 分类器
系统为您推荐了相关专利信息
1
一种基于数据分析的轨道交通枢纽旅客需求预测方法及系统
需求预测方法 旅客 特征提取模块 多维特征向量 空间特征提取
2
文档处理方法、计算设备及计算机可读存储介质
层级 大语言模型 格式 可读存储介质 策略
3
一种基于多源影像配准的无人机影像几何纠正系统和方法
影像 控制点 纠正方法 坐标系 纠正系统
4
一种基于容器化的电力系统模型推理分析方法及装置
电力系统模型 断路器故障诊断 信息模块 分析方法 负荷预测模型
5
边缘场景下的磁盘隔离方法、装置、设备及存储介质
虚拟磁盘设备 磁盘隔离方法 目录 程序二进制文件 文件系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号