摘要
本发明提出了一种基于大语言模型的数据集关键词生成及筛选方法,属于自然语言处理和人工智能领域。所述方法包括:收集评论文本数据及其已知关键词;文本数据分块;大语言模型生成初步关键词;结合TF‑IDF算法和TextRank算法对初步关键词列表中的初步关键词进行初步筛选;通过大语言模型对初步筛选后的关键词进行语义与情感相关性筛选,得到最终关键词。本发明在关键词生成与筛选技术上取得了显著进步,特别适用于需要高精度、高效率的大规模文本分析任务。
技术关键词
关键词
大语言模型
筛选方法
文本
语义
数据
列表
词语
BERT模型
筛选技术
算法
滑动窗口
论文
自然语言
分块
主题
网络
高效率
节点
系统为您推荐了相关专利信息
语音识别模型
卡片学习机
语音识别方法
梅尔频率倒谱系数
语音识别解码
关键词
信息处理方法
标识
光学字符识别技术
电子设备
水情数据
查询处理方法
大语言模型
数据管理
关键词
网络管理策略
网络管理信息
管理网络设备
访问控制列表
网络管理方法
分布特征
度计算方法
语义向量
决策
大屏可视化系统