一种文本的拆分标记生成方法、装置、介质及电子设备

AITNT
正文
推荐专利
一种文本的拆分标记生成方法、装置、介质及电子设备
申请号:CN202411724418
申请日期:2024-11-28
公开号:CN119670690A
公开日期:2025-03-21
类型:发明专利
摘要
本发明涉及文本处理领域,特别是涉及一种文本的拆分标记生成方法、装置、介质及电子设备。包括:获取每一滑动窗口在待处理文本中对应子文本的摘要信息;生成任意两个相邻摘要信息之间语义变化幅值;当任一语义变化幅值大于变化阈值时,在相邻的两个摘要信息中,较前的摘要信息对应的滑动窗口尾部位置生成拆分标记。本发明将一个完整的文本拆分成多个子文本,然后通过相邻的两个子文本对应的语义向量之间的余弦距离,来反映出两个相邻子文本所描述的情景之间的变化大小,并以此来作为文本拆分的依据,将整个待处理文本进行合理拆分标记。由此可以为创作人提供更加清晰的作品的情节布置结构,利于后续的修改,同时提高创作效率与质量。
技术关键词
标记生成方法 语义向量 文本 摘要 幅值 非瞬时性计算机可读存储介质 滑动窗口 字符 BERT模型 标识符 标记生成装置 电子设备 处理器 族群 语句 聚类 模块 存储器
系统为您推荐了相关专利信息
1
一种基于专利数据的技术生命周期预测方法及系统
生命周期预测方法 分类号 数据 关键词 训练特征
2
网页篡改的监测方法、计算机程序产品、设备及存储介质
语义分析模型 文本 历史页面 快照 Word2Vec模型
3
基于大语言模型推理的无监督网络流量检测方法、装置、设备和介质
文本特征向量 标签 大语言模型 网络流量检测方法 语义向量
4
基于视频分析与大数据融合的智能通讯监控系统
视频流 子模块 视频分析 视频段 面部关键点检测
5
文档图像分类方法、装置、设备、存储介质和程序产品
文档图像分类方法 文档特征 计算机执行指令 训练集 图像分类装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号