基于语言模型的训练语料生成方法、系统、终端及介质

AITNT
正文
推荐专利
基于语言模型的训练语料生成方法、系统、终端及介质
申请号:CN202510129515
申请日期:2025-02-05
公开号:CN119578416B
公开日期:2025-04-25
类型:发明专利
摘要
本发明公开了基于语言模型的训练语料生成方法、系统、终端及介质,涉及人工智能技术领域。所述方法通过获取原始待训练语料,根据所述原始待训练语料获取目标段落;从多种类型的增强训练语料提示中选择目标增强训练语料提示,其中每种类型的增强训练语料提示用于生成不同类型的增强训练语料;根据所述目标段落和所述目标增强训练语料提示,通过第一语言模型生成增强训练语料;基于所述增强训练语料构建合成训练语料。本发明预先设置了多种类型的增强训练语料提示,通过增强训练语料提示指引语言模型在原始训练语料的基础上合成新的文本语料,有效地提高了训练语料的规模,并丰富了训练语料的多样性。
技术关键词
语料生成方法 实体 节点 图谱 邻居 字典 关系 计算机终端 人工智能技术 处理器 可读存储介质 程序 指令 模块 存储器 文本 规模
系统为您推荐了相关专利信息
1
手写信息处理方法及装置、显示设备和电子设备
手写信息处理方法 书写信息处理装置 身份 非瞬态计算机可读存储介质 书写显示设备
2
基于移动感知机器人的城市环境监测方法
城市环境监测方法 感知机器人 图像采集节点 图像采集控制 环境监测数据
3
一种智能电网的安全运行方法和系统
智能电网 异常流量 环形缓冲区 数据 地理位置特征
4
一种面向复杂结构精密零件的加工质量监测系统及方法
精密零件 空间分布特征 融合特征 三维点云重建 纹理特征
5
便携式设备访问拦截方法及系统
便携式设备 访问拦截方法 拦截系统 策略 模糊C均值聚类算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号