样本数据的筛选方法、模型训练方法、装置、服务器及存储介质

正文

推荐专利

申请号：CN202411403033

申请日期：2024-09-30

公开号：CN119397016B

公开日期：2025-10-03

类型：发明专利

摘要

本申请涉及人工智能领域，公开了一种样本数据的筛选方法、模型训练方法、装置、服务器以及存储介质，其中，该筛选方法通过构建语料数据库，获取待预测的第二文本数据，并利用初始语义识别模型对第二文本数据进行分类，得到第二文本数据对应的第二文本向量、第二文本数据对应的第二文本意图及第二文本意图对应的第二概率分布；根据第二文本向量从语料数据库中确定与第二文本数据匹配的多个第一文本数据作为目标文本数据，并获取目标文本数据对应的第一文本意图的第一概率分布；分别计算每个第二文本数据对应的第二概率分布和各个目标文本数据的第一概率分布的概率分布差异，并根据概率分布差异从第二文本数据中筛选出目标样本数据。

技术关键词

文本语义识别模型训练方法意图样本筛选方法分支模型训练模块可读存储介质存储计算机程序服务器队列处理器数据更新匹配模块网络结构

系统为您推荐了相关专利信息

一种结合静态参数和动态参数的电网新能源功率预测方法

动态参数模型交叉验证法优化电力资源静态特征功率值

一种基于图神经网络和协同注意力机制的双向就业推荐系统及方法

协同注意力 BiLSTM模型就业推荐系统节点就业推荐方法

展示方法、处理方法、系统、设备、存储介质及程序产品

数据处理方法界面展示方法策略信息项客服

一种基于机器人的智能会议备忘录生成方法

信息整合技术麦克风阵列采集语音特征更新知识图谱波束成形技术

一种基于护理领域自适应的多模态主观题智能判卷方法及系统

判卷方法答案判卷系统文本术语

样本数据的筛选方法、模型训练方法、装置、服务器及存储介质

站点导航

APP 下载