摘要
本发明提供一种基于莱文斯坦距离算法的专利交易行为识别方法及系统,其方法包括:对待识别的专利文本进行预处理,筛除待识别的专利文本中非市场化转让行为的专利文本,得到第一类专利文本;基于第一类专利文本的转让方和受让方的外部投资关系,筛除第一类专利文本中存在待外部投资行为的专利文本,得到第二类专利文本;基于莱文斯坦距离算法确定第二类专利文本的转让方和受让方的名称和/或地址的文本相似度,将文本相似度符合预设阈值条件的第二类专利文本对应的专利交易行为确认为有效专利交易行为。本发明通过综合运用了文本分词、排序和莱文斯坦距离算法,逐步对待识别的专利文本进行筛除,并结合企业关系验证,构建了系统化的筛选流程。
技术关键词
文本
识别方法
算法
非暂态计算机可读存储介质
比率
处理器
分词
计算机程序产品
识别系统
关系
识别模块
存储器
电子设备
企业
系统为您推荐了相关专利信息
知识检索方法
大语言模型
查询意图
企业
检索策略