摘要
本申请提供一种基于视频字幕的文本数据的处理方法、装置、设备及产品。该方法包括:获取视频的字幕文本;其中,字幕文本表征视频中的语音内容;根据预设的字幕长度,基于预设的断句模型,确定字幕文本中的断句字符;其中,断句字符为字幕文本中进行断句的文本字符,预设的断句模型为预训练的自然语言处理模型,用于确定文本字符为断句字符的可能性;根据字幕文本中的断句字符,对字幕文本进行断句处理,得到断句文本,并将断句文本显示在视频的视频帧上;其中,断句字符与断句文本一一对应,断句字符为对应的断句文本中的最后一个字符。本申请的方法,提高了对视频字幕的文本进行断句的准确性。
技术关键词
字幕
字符
训练文本数据
标签
计算机执行指令
视频
自然语言
长短期记忆网络
LSTM模型
处理器
可读存储介质
计算机程序产品
训练装置
语音
存储器
电子设备
语义
系统为您推荐了相关专利信息
设备运行数据
时间同步
射频识别标签
环境传感器
图像采集模块
文本
模型训练方法
计算机可执行指令
自然语言模型
字符
多无人机协同
航迹规划方法
障碍物
动态障碍
合同网协议
数据融合方法
加密
机器学习算法
分布式文件系统
异构
有害重金属离子
多模态
纳米颗粒
水溶性聚合物
转换发光材料