摘要
本发明属于数据合成技术领域,尤其涉及一种基于大语言模型的蜂窝用户App使用数据合成方法,分为以下步骤:(1)文本编码方法,对真实的表格数据进行文本编码,将App表格数据转换为文本序列表示;(2)预训练微调,使用文本数据集对预训练生成式大语言模型进行微调;(3)App数据采样合成,使用微调好的预训练生成式大语言模型采样生成文本序列数据,并将文本序列数据转换为表格数据,得到合成的表格数据集;本发明具有以下有益效果:该方法允许用户通过多种输入提示设置对数据生成过程进行概率控制,用户可以根据自己的需求,灵活定义条件实现App使用数据的可控合成,合成数据的质量和在下游应用中的可用性更高。
技术关键词
大语言模型
数据
序列
生成方式
文本编码方法
表格
梯度下降算法
编码特征
样本
定义
参数
矩阵
解码
格式
特征值
代表
元素
系统为您推荐了相关专利信息
计算资源调度方法
平台
云计算资源调度
资源余量数据
资源需求数据
灵敏度矩阵
电压
解码器结构
动态变化数据
注意力机制
启发式规则
地球观测卫星
任务分配策略
深度Q学习网络
任务分配模型
样本
语义向量
BERT模型
大语言模型
预训练语言模型