基于互联网大数据和AI大语言模型的产品标签提取方法

正文

推荐专利

申请号：CN202510083215

申请日期：2025-01-20

公开号：CN120012774B

公开日期：2025-07-29

类型：发明专利

摘要

本发明涉及产品标签提取技术领域，具体地说，涉及基于互联网大数据和AI大语言模型的产品标签提取方法。其包括以下步骤：S1、使用爬虫技术抓取互联网上产品的文本数据；S2、采用TF‑IDF算法确定文本数据中的重要词汇，并结合Skip‑Gram模型来捕捉词汇间的语义关联，在捕捉词汇间语义关联的过程中引入反映用户浏览频率的权重和用户的行为特征向量来优化捕捉过程；S3、基于提取的重要词汇和词汇间的语义关联信息，利用大规模预训练的语言模型生成产品标签；S4、结合序列标注模型BERT和条件随机场CRF定位和分类产品标签，输出最终提取的产品标签。本发明技术利用BERT模型和条件随机场(CRF)层相结合的方式，可以有效地对产品标签进行定位和分类。

技术关键词

互联网大数据生成产品标签条件随机场序列标注模型 Viterbi算法 BERT模型分类产品语义转移概率矩阵文本爬虫技术 Sigmoid函数索引聚类方法高维向量空间频率预训练语言模型

系统为您推荐了相关专利信息

一种基于跨模态引导交互融合的多模态命名实体识别方法

命名实体识别方法跨模态文本图像语义

一种面向电力行业的语言理解与对话生成方法

答案对话策略多轮对话依存句法分析面向电力行业

一种基于依存句法和图神经网络的多模态命名实体识别方法

命名实体识别方法文本依存句法预训练模型上下文特征

关系增强型命名实体识别方法、设备、介质及程序产品

语义序列命名实体识别方法关系奇异值分解重构

一种基于DeepLabv3+与R(2+1)D网络的心脏超声视频左心室分割及射血分数计算方法

左心室射血分数左心室容积智能裁剪可视化分析图表关键帧

基于互联网大数据和AI大语言模型的产品标签提取方法

站点导航

APP 下载