一种文本归类方法及装置

正文

推荐专利

一种文本归类方法及装置

申请号：CN202411542108

申请日期：2024-10-31

公开号：CN119493865A

公开日期：2025-02-21

类型：发明专利

摘要

本申请公开了一种文本归类方法及装置，获取待分类文本集合和类目集合；将多个类目输入中文词向量模型中得到多个类目向量；对于每个待分类文本，对待分类文本进行数据预处理；将预处理后的待分类文本向量转换成高维向量；对于每个类目向量，计算类目向量和高维向量之间的余弦相似度；从高维向量与每个类目向量之间的相似度中，筛选出相似度最高的类目向量，并标识为目标类目向量；将高维向量对应的待分类文本，添加至目标类目向量对应的类目中。在向量转换的过程中充分分析了词语信息，根据词语信息进行转换，并且计算类目向量和高维向量之间的余弦相似度，根据相似度进行类目划分，减少了因理解偏差导致的错误划分，实现了精准的文本归类。

技术关键词

词语文本词向量模型归类方法输入中文转换单元字符归类装置存储单元数据分词标识频率参数偏差

系统为您推荐了相关专利信息

用于大模型的任务执行方法、装置、电子设备、存储介质及程序产品

存储单元基础文本矩阵深度学习技术

模型优化方法、文本生成方法、装置及电子设备

模型优化方法文本生成方法音频文本生成装置通信接口

医疗元组生成方法与装置、电子设备及存储介质

病历文本生成方法大语言模型数据

基于大模型和地理信息的客户挖掘方法、装置及设备

客户挖掘方法企业地理围栏算法待售产品计算机设备

一种基于多模态模型的档案信息检索方法

信息检索方法多模态分类正确率标签神经网络模型

一种文本归类方法及装置

站点导航

APP 下载