摘要
一种语义拼接方法、系统、电子设备及存储介质,涉及数据处理技术领域。该方法包括:对原始文档进行语义边界识别并切分为文本单元,然后构建包含局部语义、全局语义和结构关联特征的多维语义特征矩阵,通过加权融合生成复合语义向量。当接收到用户查询时,从查询文本中提取关键词和语法结构形成带意图权重的增强查询向量,计算与复合语义向量的余弦相似度来筛选候选文本片段。接着基于位置索引信息查找相邻文本片段,计算语义连贯度以确定待拼接片段,最后按位置顺序将候选片段与待拼接片段进行文本拼接并去重,从而生成上下文连贯的复合文本片段。实施本申请提供的技术方案,能够对文本进行智能拼接,从而提高上下文的连贯性。
技术关键词
文本
语义特征
拼接方法
查询关键词
语法结构
语义向量
意图类别
语义相关度
索引
电子设备
矩阵
双向注意力
网络接口
序列
拼接系统
可读存储介质
解析算法
数据处理技术
系统为您推荐了相关专利信息
通信传输方法
音频编码格式
音视频
服务器
加权算法
智能生成方法
规划
知识图谱优化
生成提示词
大语言模型
多维分析方法
强度
语义特征
网络舆情监测
sigmoid函数