长文本训练数据生成方法、相关装置及计算机程序产品

AITNT
正文
推荐专利
长文本训练数据生成方法、相关装置及计算机程序产品
申请号:CN202510987255
申请日期:2025-07-17
公开号:CN120804714A
公开日期:2025-10-17
类型:发明专利
摘要
本申请公开了一种长文本训练数据生成方法、相关装置及计算机程序产品,涉及人工智能领域,本申请首先获取长文本源数据,而后利用大语言模型的生成能力生成长文本源数据的相关问题和对应答案,并基于所生成的各答案之间的相似度进行答案自我一致性校验,确定出可信度最高的答案,作为最终答案,再利用长文本源数据、相关问题和对应的最终答案生成长文本训练数据,实现了长文本训练数据生成任务,提高了适用于长文本处理任务的训练数据配置效率和质量,为优化大模型在长文本处理任务上的模型性能提供基础。
技术关键词
训练数据生成方法 答案 计算机程序产品 关键词 编码向量 数据生成装置 数据获取单元 大语言模型 文本识别 处理器 字符 切片 可读存储介质 语音 存储器 电子设备 词语
系统为您推荐了相关专利信息
1
破损纸币识别方法、设备、介质及程序产品
破损纸币 图像识别模型 二值化图像 识别方法 图像拼接
2
一种合规报告生成方法、装置、设备及存储介质
报告生成方法 子模块 有向无环图 模板 文件夹
3
一种声学红外特征融合的电力设备缺陷识别方法及系统
功率谱特征 电力设备缺陷 图谱特征 音频 特征提取网络
4
一种基于大模型的网络安全态势感知预测系统及方法
编码向量 网络安全态势感知 跨模态 语义特征 网络流量数据
5
基于联邦学习与目标检测算法的肺结节检测系统及方法
结节检测方法 CT数据集 客户端 更新模型参数 加权平均法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号