训练样本的生成方法、装置、设备、介质及程序产品

AITNT
正文
推荐专利
训练样本的生成方法、装置、设备、介质及程序产品
申请号:CN202411963006
申请日期:2024-12-27
公开号:CN119903916A
公开日期:2025-04-29
类型:发明专利
摘要
本申请实施方式提供了一种训练样本的生成方法、装置、设备、介质及程序产品。所述方法包括:从固定内容文件中识别得出文本数据段;基于所述文本数据段和所述固定内容文件调用多模态大模型,生成所述固定内容文件对应的目录数据;其中,所述目录数据包括与文本数据段对应的目录项;所述目录项用于指示文本数据段的位置;依照所述目录项排列所述文本数据段得到所述固定内容文件对应的目标文本数据;其中,所述固定内容文件和所述目标文本数据形成所述训练样本。训练样本的生成方法、装置、设备、介质及程序产品可以实现对固定内容文件包含的文本信息的结构化处理,增强训练样本的结构化程度,提升专业领域的专用大模型的训练效果。
技术关键词
文本 数据 目录 生成方法 计算机程序产品 多模态 计算机设备 可读存储介质 关系 生成装置 处理器 识别模块 存储器 专业 标记
系统为您推荐了相关专利信息
1
一种宠物声音监测方法
声音监测方法 序列 编码 分类阈值 多通道
2
细胞制备全流程质量智能评估系统及其方法
智能评估系统 时序卷积神经网络 SVM分类器 环境监测数据 指标评价体系
3
性能模拟器的验证方法、装置、设备、介质及程序产品
模拟器 执行面向对象 片上系统 验证方法 检查工具
4
一种基于图像特征识别的消泡剂泡沫分布分析方法
分布分析方法 泡沫 图像特征识别 序列 连续性
5
数据通信设备内部硬件异常的识别方法、存储介质、电子装置和计算机程序产品
报文统计 数据通信设备 计算机程序产品 识别方法 颜色
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号