摘要
本申请公开一种基于文本信息的关键词分类方法、装置、设备及存储介质,涉及计算机技术领域,该方法包括:获取原始文本信息,利用预设语言模型对至少一条文本进行评分,对至少一条文本进行择优筛选,得到一条或多条目标文本;利用预设模型计算一条或多条目标文本对应的至少一个嵌入向量,并将至少一个嵌入向量输入至文本处理算法进行语义相似度评估,得到至少一个关键词,以及每个关键词与目标文本之间的对应关系;通过聚类算法对至少一个关键词分类,生成关键词摘要和对一条或多条目标文本的分类结果。本方法通过嵌入向量计算词语间的语义相似度,更准确地捕捉文本间的细微语义差异,从而提取出与文本内容高度相关的关键词,提高准确性和相关性。
技术关键词
关键词分类方法
文本处理算法
语义
聚类算法
词语
生成关键词
关系
可读存储介质
摘要
存储计算机程序
排序算法
身份证号
分类装置
处理器
计算机设备
字符
冗余
模块
系统为您推荐了相关专利信息
数据解析方法
行业知识图谱
深度学习模型
关键词
文本识别
动态规划算法
家居设备组网系统
参数
可执行程序代码
聚类算法
覆盖路径规划方法
无人艇集群
网格
矩形
松弛模型
关联规则算法
模块
项目
时间序列特征
非易失性计算机可读存储介质