摘要
本发明公开了一种基于零样本投票器的文献智能筛选方法及系统,包括:基于种子文献扩展文献集,构建包含多个零样本投票器的分类系统,通过多数投票机制筛选与目标主题相关的文献,并以此迭代扩充得到更多与目标主题相关的文献。零样本投票器整合了主题词匹配、预训练语言模型、多大型语言模型投票、以及语义嵌入向量技术,结合改进的二分搜索算法自适应确定阈值,实现无需训练数据的高精度分类。系统支持并行化处理和智能API管理,显著提升大规模文献集的处理效率。本发明适用于学术研究、文献检索等领域,能够快速构建大规模高相关性的文献信息库,尤其适应新兴技术或跨学科主题的检索需求。
技术关键词
智能筛选方法
投票器
样本
预训练语言模型
主题
种子
语义
多线程并行处理
标识符
搜索算法
数据收集模块
分类边界
分类系统
机制
摘要
批量
分类器
系统为您推荐了相关专利信息
语义分割模型
列车轨道
语义分割方法
重构单元
分支
文本生成图像
样本
图像生成模型
训练集
排序方法
反演方法
随机森林模型
太阳方位角
时间序列影像
网格搜索算法
专业性内容智能化生成方法
语义
BERT模型
文本
主题