基于大数据和深度学习的文本数据处理方法

正文

推荐专利

基于大数据和深度学习的文本数据处理方法

申请号：CN202510151256

申请日期：2025-02-11

公开号：CN120067320A

公开日期：2025-05-30

类型：发明专利

摘要

本发明公开了基于大数据和深度学习的文本数据处理方法，其步骤包括构建文本大数据集，收集文本数据存储，并设置数据收集层参数，数据收集层负责获取来自多种来源的不同格式文本信息，使用数据预处理器，整理原始输入文本并完成标准化转换，选用特征提取器，将预处理后文本提取生成高质量特征表示，并生成标签，设置分类判定室，并在分类判定室内设置分类器集群，每个子分类器专注于某一类别的细粒度识别，对特征提取器生成标签进行识别对比，设置查询引擎，允许用户自定义复杂的筛选条件和排序逻辑，汇总统计，借助高速通道返回给前端界面展示成果报告。本发明属于数据处理领域，具体是指基于大数据和深度学习的文本数据处理方法。

技术关键词

文本数据处理方法数据预处理器大数据特征提取器生成标签分类器 BERT模型文本特征提取方法分布式数据库技术 NLP技术数据存储神经网络模型集群资源共享跨节点生态系统逻辑主节点

系统为您推荐了相关专利信息

基于大数据分析的包装设计优化系统及方法

产品包装图像块特征编码向量图像处理单元图像特征提取

一种基于数字孪生及智能传感器的森防方法及系统

智能传感器数字孪生模型林区大数据分析技术三维虚拟模型

一种行业私有云建设全过程成熟度的评价方法

云平台功能模块功能测试用例分词评价量表

电子证据的可信存证方法、装置、系统及存储介质

可信存证方法分片策略电子客户可信存证系统

一种基于大数据的电缆工程智能造价方法

大数据处理技术多层感知机土建表达式造价

基于大数据和深度学习的文本数据处理方法

站点导航

APP 下载