摘要
本申请涉及文本数据生成技术领域,具体涉及基于大模型的文本自动化生成方法及大数据平台,该方法包括:分析各领域的每个词汇与不同聚类中心之间的隶属度,结合源领域与目标领域之间任意两个词汇的词汇向量的相似度,确定词汇关联度;基于源领域与目标领域之间任意两个聚类中心的词汇关联度,并结合所述任意两个聚类中心在不同主题下的概率分布,确定主题关联度;通过分析源领域与目标领域之间所有聚类簇的隶属度向量的差异,确定差异度,结合主题关联度,将源领域文本数据集迁移学习至目标领域。本申请旨在优化迁移学习的方式,提高目标生成文本的质量和准确性。
技术关键词
自动化生成方法
主题
聚类
数据平台
预训练模型
数据生成技术
迁移学习技术
注意力机制
文本生成模型
表达式
生成大数据
BERT模型
处理器
语义
存储器
样本
系统为您推荐了相关专利信息
边坡支挡工程
模型生成方法
三维扫描数据
土石方
抗滑桩施工方法
理解系统
多模态数据采集
多模态特征融合
强化学习算法
非临时性存储介质