摘要
本发明提供一种文本相似度确定模型的训练方法及文本相似度计算方法,属于计算机技术领域,该训练方法包括:获取第一数据集和第二数据集;第一数据集中包括至少一个短文本数据对;第二数据集中包括至少一个目标文本数据对,目标文本数据对中的两个目标文本数据至少一个为长文本数据;基于句向量对比模型,获取第二数据集中各目标文本数据的关键表述;句向量对比模型是基于第一数据集和第一损失函数对第一预训练模型训练得到的;基于各关键表述和第二损失函数,对第二预训练模型进行训练,得到文本相似性确定模型。通过在判定过程中引入短文本和长文本,提升了文本相似度确定模型输出结果的准确性。
技术关键词
文本
预训练模型
加权PageRank算法
数据
度计算方法
节点
非暂态计算机可读存储介质
处理器
模块
存储器
电子设备
阻尼
标签
程序
系统为您推荐了相关专利信息
丝印油墨配方
加速老化测试
分子间相互作用
参数
优化工艺流程
数字仿真模型
中央空调能耗
优化运行策略
优化控制方法
智能优化算法