一种基于大语言模型的数据集关键词生成及筛选方法

AITNT
正文
推荐专利
一种基于大语言模型的数据集关键词生成及筛选方法
申请号:CN202411592080
申请日期:2024-11-08
公开号:CN119474339A
公开日期:2025-02-18
类型:发明专利
摘要
本发明提出了一种基于大语言模型的数据集关键词生成及筛选方法,属于自然语言处理和人工智能领域。所述方法包括:收集评论文本数据及其已知关键词;文本数据分块;大语言模型生成初步关键词;结合TF‑IDF算法和TextRank算法对初步关键词列表中的初步关键词进行初步筛选;通过大语言模型对初步筛选后的关键词进行语义与情感相关性筛选,得到最终关键词。本发明在关键词生成与筛选技术上取得了显著进步,特别适用于需要高精度、高效率的大规模文本分析任务。
技术关键词
关键词 大语言模型 筛选方法 文本 语义 数据 列表 词语 BERT模型 筛选技术 算法 滑动窗口 论文 自然语言 分块 主题 网络 高效率 节点
系统为您推荐了相关专利信息
1
一种用于卡片学习机的语音识别方法及系统
语音识别模型 卡片学习机 语音识别方法 梅尔频率倒谱系数 语音识别解码
2
一种网站信息处理方法及装置
关键词 信息处理方法 标识 光学字符识别技术 电子设备
3
一种水情数据监视查询处理方法及系统
水情数据 查询处理方法 大语言模型 数据管理 关键词
4
网络管理方法、装置、电子设备及存储介质
网络管理策略 网络管理信息 管理网络设备 访问控制列表 网络管理方法
5
数据大屏可视化方法、系统、设备及存储介质
分布特征 度计算方法 语义向量 决策 大屏可视化系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号