摘要
本公开提供了一种数据生成方法、装置、电子设备、存储介质及程序产品,涉及人工智能技术领域。所述方法包括:获取多个文档;根据多个文档构建跨文档知识概念图,跨文档知识概念图包括多个知识概念节点和多个边权重,边权重为同一文档中两个不同知识概念对应的知识概念节点之间的权重;根据多个知识概念节点和多个边权重,得到知识组合;从多个文档中确定出与知识组合相关的语义内容;将知识组合和语义内容输入到大模型中,生成微调数据。本公开可以实现有效融合跨文档的知识,生成提升大模型处理能力的微调数据。
技术关键词
概念
数据生成方法
节点
语义
数据生成装置
电子设备
处理器
可读存储介质
人工智能技术
指令
计算机程序产品
模块
编码
强度
格式
存储器
系统为您推荐了相关专利信息
智能语义识别
厨师机
语音采集模块
控制模块
参数
渗漏检测方法
视频帧
视频块
语义分割神经网络
角膜