摘要
本申请涉及一种文本相似度检测、文本相似度检测模型的训练方法及装置。方法包括:获取第一待测文本和第二待测文本;将第一待测文本和第二待测文本输入文本相似度检测模型,并获取文本相似度检测模型输出的第一待测文本和第二待测文本之间的相似度标签;其中,文本相似度检测模型是通过目标样本数据集训练后生成的,目标样本数据集为提示词工程驱动语言模型对初始语料数据扩充后生成的样本数据集,文本相似度检测模型中包括双向长短期记忆网络LSTM模块和多尺度卷积注意力模块,双向LSTM模块和多尺度卷积注意力模块用于对文本相似度检测模型的输入数据进行特征提取。采用本方法能够提高文本相似度检测准确度。
技术关键词
文本
样本
双向长短期记忆网络
标签
模块
注意力
序列
生成答案
置信度阈值
大语言模型
度检测方法
度检测装置
分类器
计算机程序产品
处理器
数据编码
训练装置
计算机设备
可读存储介质
系统为您推荐了相关专利信息
故障知识库
上下文特征
语义向量
BERT模型
文本
维修策略优化方法
可靠性分析方法
词典
风险
运维故障
摘要生成方法
深度学习模型
图书馆
语义角色标注
实体知识库
邻域
图像配准方法
像素点
多约束条件
特征描述符
更新方法
误差补偿单元
更新系统
相位累加器
控制模块