摘要
本发明属于人工智能领域,具体涉及一种基于大语言模型的水印生成方法及系统,包括:获取训练数据集,对训练数据集中的数据进行预处理;预设水印编码规则;根据水印编码规则采用预处理后的数据对大预言模型进行训练;获取待处理文本数据;对文本数据进行清洗和标准化处理;计算标准化文本数据的词频和逆文档频率,生成初始向量;采用Word2Vec模型对初始向量进行处理,得到高维词向量;将高维词向量输入到训练后的神经网络模型中,提取深层特征;根据深层特征对文本进行分类;将分类后的问题输入到训练后的大预言模型中,生成对应文本类型的水印;本发明设计了一种水印编码规则,并为分类后的文本生成对应的水印,从而提高了文本的安全性。
技术关键词
水印生成方法
大语言模型
编码规则
Word2Vec模型
文本
错误率
并行策略
特征提取模块
SMOTE算法
训练神经网络模型
数据获取模块
神经网络架构
更新网络参数
生成哈希值
分布式训练
输出模块
优化器