摘要
本发明提供了一种基于大语言模型的跨平台数据融合方法,该方法首先将信息量较少的文本作为源属性文本,以从中提取较少的原子信息来从更大的目标属性文本中寻找候选语句集合,从而为整个系统的高效执行做好准备;其次,基于原子信息构建候选语句集合;然后,挖掘与原子信息的来源句对应的目标属性文本中的关联语句;最后,利用基于信息量的内容融合机制,通过保留相似语句中信息量最大的语句,在其基础上补充另一句子中含有的增量信息,构建融合文本。整个方法使用大语言模型搭建起基础架构,可适应多种不同领域的跨网络目标属性融合任务;解决了属性文本过长导致的融合效率低、以及特殊领域文本特异性导致的融合准确率差的问题。
技术关键词
大语言模型
文本
语句
跨平台数据
数据融合方法
关键词
计算机程序产品
处理器
指令
模板
可读存储介质
存储器
电子设备
词语
语义
实体
机制
系统为您推荐了相关专利信息
射频连接器
可视化图表
识别检测方法
文本识别模型
识别检测系统
优化加速方法
特征值计算方法
神经网络模型
矩阵
图像分类模型
工程项目信息
工程项目数据
智能系统
文本识别模型
动态