重复文本的删除方法、装置、计算机设备、存储介质和程序产品

AITNT
正文
推荐专利
重复文本的删除方法、装置、计算机设备、存储介质和程序产品
申请号:CN202510348306
申请日期:2025-03-24
公开号:CN120216668A
公开日期:2025-06-27
类型:发明专利
摘要
本申请涉及一种重复文本的删除方法、装置、计算机设备、存储介质和程序产品。所述方法包括:对目标投标文件中的各个候选文本进行特征提取,得到各个候选文本分别对应的第一词袋向量;在根据各个候选文本分别对应的第一词袋向量和招标文件中的文本信息,确定目标候选文本为招标文件中包括的文本的情况下,并将目标候选文本从目标投标文件中删除,以得到最终投标文件。本申请通过对投标文件的文件内容进行特征提取,极大提高了投标文件中与招标文件的内容重复的文本的识别效率,从而提高了投标文件中与招标文件的内容重复的文本的删除效率。
技术关键词
文本 删除方法 计算机设备 分词 BERT模型 计算机程序产品 处理器 可读存储介质 存储器 转换器 编码器 分段 模块
系统为您推荐了相关专利信息
1
视觉语言模型微调方法、装置、计算机设备及存储介质
微调方法 强化学习算法 答案 视觉 基础
2
一种基于LLM和RAG的企业知识机器人系统
机器人系统 词嵌入技术 企业 重排技术 问答系统
3
估计电梯位置的方法、装置、设备、存储介质和程序产品
电梯曳引机 电流 电梯轿厢 有效值 频率
4
一种无人船测量航路生成算法
生成算法 无人船 参数 数据 速度
5
激光陀螺仪健康状态评估方法、装置、设备及存储介质
证据推理规则 激光陀螺仪 健康状态评估方法 状态评估装置 框架
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号