摘要
本发明属于数据处理技术领域,具体涉及一种网络媒体推送数据匹配方法及其系统,该方法包括步骤1:解析抓取文章的标,并对标题进行查重;步骤2:对所述标题进行处理;步骤3:对标题进行搜索,并将标题和搜索的标题进行相似度计算,若有相似度高于第一阈值的搜索文章抓取并存入抓取库;步骤4:将标题进行分词,并对每个分词进行搜索,统计搜索结果中同一标题出现次数,根据分词命中计算得分,将得分高于第二阈值的搜索文章抓取并存入抓取库;本发明提出了一种创新的推送数据匹配方法,这种方法能够实现快速匹配,自动发布推送稿件,大大提高了工作效率和新闻推送的及时性。
技术关键词
数据匹配方法
文章
分词
关键词
数据处理技术
抓取模块
匹配模块
字符
系列
算法
系统为您推荐了相关专利信息
关键词
个性化新闻
语句
推送方法
RNN神经网络
双语词典
神经机器翻译方法
机器翻译模型
中文关键词
编码器
面向公共安全
态势分析方法
大语言模型
计算机可执行指令
关键词