基于语言模型与特征相关性的结构化数据生成方法及装置

AITNT
正文
推荐专利
基于语言模型与特征相关性的结构化数据生成方法及装置
申请号:CN202510071410
申请日期:2025-01-16
公开号:CN120105091A
公开日期:2025-06-06
类型:发明专利
摘要
本发明提供了一种基于语言模型与特征相关性的结构化数据生成方法及装置,具有这样的特征,包括:预处理步骤,生成预处理值;相关性计算步骤,得到所有特征两两之间的相关性值;相关性筛选步骤,根据预设阈值和相关性值,从所有两两特征中选取两两特征作为相关特征对;相关文本生成步骤,对各个相关特征对,生成描述对应的两个特征的关系的文本作为关系描述文本;初始文本生成步骤,生成样本的各个特征对应的初始文本;训练文本生成步骤,将初始文本和关系描述文本结合,得到对应的训练样本;模型训练步骤,通过训练样本训练语言模型;合成数据生成步骤,通过语言模型生成合成结构化数据。总之,本方法能够生成更加准确有效的合成结构化数据。
技术关键词
相关性计算方法 文本 构建语言模型 皮尔逊相关系数 样本 斯皮尔曼相关系数 数据生成装置 训练语言模型 模型训练模块 编码 表达式 数学 数值
系统为您推荐了相关专利信息
1
用于目标对象检测的方法、处理器及机器可读存储介质
特征点 关键点特征 机器可读存储介质 对象检测 多尺度语义特征
2
语音识别方法及相关装置、设备和存储介质
大语言模型 编码特征 样本 文本 语音识别方法
3
基于视觉的宠物撕咬行为识别方法、装置、设备及介质
实时图像 关键帧 识别方法 实时视频 动作识别模型
4
一种基于物联网的大数据资源查询方法及系统
查询关键词 语义关联度 资源查询方法 偏好特征 文本
5
一种用于检测去中心化金融协议依赖关系的系统与方法
区块链协议 智能合约部署 分析模块 数据平台 抽象语法树
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号