摘要
本发明公开了一种基于知识蒸馏的语义文本表征方法、系统及存储介质,原始文本数据分别输入学生模型和若干教师模型中;学生模型对原始文本数据进行嵌入处理得到文本向量表示;各教师模型分别计算原始文本与正、负样本之间的余弦相似度,作为第一软标签输入至智能体中;教师模型与智能体关联,通过教师模型与智能体交互,动态确定每个教师模型对应的权重;智能体依权重对第一软标签聚合处理,输出第二软标签;第二软标签经过分级蒸馏处理后输入学生模型内,得到最终文本向量表示;通过各教师模型与智能体关联,实现不同训练阶段教师模型贡献度权重的自适应分配,得到的文本向量表示准确率高,方法易收敛;在文本向量表征方面具有突出性能。
技术关键词
文本
表征方法
蒸馏
表征系统
标签
语义
引入经验回放机制
教师
预训练语言模型
强化学习框架
智能体交互
样本
算法结构
神经网络模型
学生
数据存储
策略
系统为您推荐了相关专利信息
个性化推荐系统
查询意图
个性化推荐算法
大语言模型
画像