文本相似度确定模型的训练方法及文本相似度计算方法

AITNT
正文
推荐专利
文本相似度确定模型的训练方法及文本相似度计算方法
申请号:CN202411003497
申请日期:2024-07-25
公开号:CN118520929B
公开日期:2024-10-29
类型:发明专利
摘要
本发明提供一种文本相似度确定模型的训练方法及文本相似度计算方法,属于计算机技术领域,该训练方法包括:获取第一数据集和第二数据集;第一数据集中包括至少一个短文本数据对;第二数据集中包括至少一个目标文本数据对,目标文本数据对中的两个目标文本数据至少一个为长文本数据;基于句向量对比模型,获取第二数据集中各目标文本数据的关键表述;句向量对比模型是基于第一数据集和第一损失函数对第一预训练模型训练得到的;基于各关键表述和第二损失函数,对第二预训练模型进行训练,得到文本相似性确定模型。通过在判定过程中引入短文本和长文本,提升了文本相似度确定模型输出结果的准确性。
技术关键词
文本 预训练模型 加权PageRank算法 数据 度计算方法 节点 非暂态计算机可读存储介质 处理器 模块 存储器 电子设备 阻尼 标签 程序
系统为您推荐了相关专利信息
1
一种数据处理方法、装置、设备、介质和程序产品
训练预测模型 分箱 预测特征 多级特征 客户
2
一种快速定位联合语义解释的半导体缺陷分析方法及系统
缺陷分析方法 图像 解码器 半导体缺陷分析 晶圆
3
一种基于数字孪生的水利工程管控系统及方法
水利设备 水情数据 管控系统 模拟单元 指标
4
基于化学模拟优化的耐高温丝印油墨的制备方法
丝印油墨配方 加速老化测试 分子间相互作用 参数 优化工艺流程
5
中央空调能耗优化控制方法、系统、电子设备和存储介质
数字仿真模型 中央空调能耗 优化运行策略 优化控制方法 智能优化算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号