摘要
本发明涉及文本处理领域,特别是涉及一种文本的拆分标记生成方法、装置、介质及电子设备。包括:获取每一滑动窗口在待处理文本中对应子文本的摘要信息;生成任意两个相邻摘要信息之间语义变化幅值;当任一语义变化幅值大于变化阈值时,在相邻的两个摘要信息中,较前的摘要信息对应的滑动窗口尾部位置生成拆分标记。本发明将一个完整的文本拆分成多个子文本,然后通过相邻的两个子文本对应的语义向量之间的余弦距离,来反映出两个相邻子文本所描述的情景之间的变化大小,并以此来作为文本拆分的依据,将整个待处理文本进行合理拆分标记。由此可以为创作人提供更加清晰的作品的情节布置结构,利于后续的修改,同时提高创作效率与质量。
技术关键词
标记生成方法
语义向量
文本
摘要
幅值
非瞬时性计算机可读存储介质
滑动窗口
字符
BERT模型
标识符
标记生成装置
电子设备
处理器
族群
语句
聚类
模块
存储器
系统为您推荐了相关专利信息
语义分析模型
文本
历史页面
快照
Word2Vec模型
文本特征向量
标签
大语言模型
网络流量检测方法
语义向量
文档图像分类方法
文档特征
计算机执行指令
训练集
图像分类装置