一种基于NLP的文本相似度分析方法及系统

正文

推荐专利

申请号：CN202410904610

申请日期：2024-07-08

公开号：CN118446203B

公开日期：2024-09-17

类型：发明专利

摘要

本发明涉及文本处理领域，公开了一种基于NLP的文本相似度分析方法及系统。包括：建立标准词库；将标准词库处理为标准特征向量集；分别对第一文本和第二文本进行文本处理，得到第一特征向量序列和第二特征向量序列；利用标准特征向量集对第一特征向量序列和第二特征向量序列进行特征向量替换和机器编码，得到第一编码序列和第二编码序列；提取第一编码序列与第二编码序列的公共子序列；分别在第一编码序列和第二编码序列中对公共子序列进行位置标记；根据位置标记获取第一文本相似度和第二文本相似度。本发明结合自然语言处理方法进行文本相似度检测，可提高检测结果的准确率，并且通过检测结果还能获得相似片段在原始文本中的位置。

技术关键词

文本特征向量度分析方法 Pearson相关系数序列自由端标记停用词表脉冲编码模块分析系统自然语言关键词爬虫摘要语义波形网络

系统为您推荐了相关专利信息

外贸函电智能语义纠错与商业术语优化方法及装置

术语风险点国际商务条件随机场模型文本

一种考虑模态缺失情境的多模态ViT视觉模型结构的构建方法

编码器视觉序列特征多模态多层感知机

手术机器人及其控制装置、方法

手术机器人克氏针夹持部件速度控制策略

一种环保污水搅拌及杂质筛选智能监测系统

筛网智能监测系统逻辑回归模型指数控制系统

基于知识图谱的抽奖用户过滤方法

过滤方法径向基函数网络知识图谱构建门控循环单元实体

一种基于NLP的文本相似度分析方法及系统

站点导航

APP 下载