摘要
本申请涉及一种剧情文本处理方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:获取多个训练样本;获取用于确定多个训练样本归属的剧情类别所采用的分类方式的数量,并获取针对一批次训练所使用的训练样本配置的剧情类别数量;根据分类方式的数量和剧情类别数量,确定从多个训练样本每种分类方式下的剧情类别中分别抽取剧情类别的剧情类别抽取数量;针对每种分类方式,按照剧情类别抽取数量,从多个训练样本在分类方式下的剧情类别中,抽取目标剧情类别,并从包含目标剧情类别的训练样本中,抽取目标训练样本,得到一批次训练所使用的训练样本;根据一批次训练所使用的训练样本,训练摘要生成模型。采用本方法能够生成准确剧情摘要。
技术关键词
分类方式
文本处理装置
预测类别
文本处理方法
训练摘要生成模型
参数
计算机程序产品
模块
聚类
计算机设备
处理器
样本
可读存储介质
存储器
编码
系统为您推荐了相关专利信息
文本处理方法
像素点
字符识别模型
光学字符识别
文本处理系统
知识蒸馏方法
多模态图像数据
融合特征
浅层特征提取
文本编码器