摘要
本申请涉及一种数据处理方法、装置、电子设备及存储介质。该方法包括:根据原始数据集的查询语句的第一语义向量、所述原始数据集的正例候选集法律条文的第二语义向量,获取负例候选集法律条文;根据所述查询语句、正例候选集法律条文和负例候选集法律条文,生成训练嵌入模型的数据集。本申请提供的方案,能够对训练嵌入模型的数据集进行优化,以提升嵌入模型的训练效果,使训练后的嵌入模型能够更精确地对法律文书进行语义理解和信息提取,提高通过训练后的嵌入模型提取法律文书的关键信息的效率和准确性。
技术关键词
语义向量
语句
数据处理方法
电子设备
处理器
数据处理装置
文本
聚类算法
可读存储介质
基准
模块
格式
存储器
计算机
样本
系统为您推荐了相关专利信息
两轮电动车
Softmax函数
数据特征提取
构建预测模型
微调方法
时间序列预测模型
数据
店铺
销量预测方法
计算机可读指令
人脸特征
文本
噪声图像
图像生成技术
上存储计算机程序