摘要
本发明公开了基于语言模型的训练语料生成方法、系统、终端及介质,涉及人工智能技术领域。所述方法通过获取原始待训练语料,根据所述原始待训练语料获取目标段落;从多种类型的增强训练语料提示中选择目标增强训练语料提示,其中每种类型的增强训练语料提示用于生成不同类型的增强训练语料;根据所述目标段落和所述目标增强训练语料提示,通过第一语言模型生成增强训练语料;基于所述增强训练语料构建合成训练语料。本发明预先设置了多种类型的增强训练语料提示,通过增强训练语料提示指引语言模型在原始训练语料的基础上合成新的文本语料,有效地提高了训练语料的规模,并丰富了训练语料的多样性。
技术关键词
语料生成方法
实体
节点
图谱
邻居
字典
关系
计算机终端
人工智能技术
处理器
可读存储介质
程序
指令
模块
存储器
文本
规模
系统为您推荐了相关专利信息
手写信息处理方法
书写信息处理装置
身份
非瞬态计算机可读存储介质
书写显示设备
城市环境监测方法
感知机器人
图像采集节点
图像采集控制
环境监测数据
智能电网
异常流量
环形缓冲区
数据
地理位置特征
精密零件
空间分布特征
融合特征
三维点云重建
纹理特征
便携式设备
访问拦截方法
拦截系统
策略
模糊C均值聚类算法