摘要
一种社会调查中的智能行业分类与编码方法及装置,属于自然语言处理、机器学习及数据分类技术领域。结合分层分类与语义匹配技术,显著提升行业编码的准确性与效率。技术方案:基于BERT模型对待编码行业文本进行行业中类判断,生成前五中类候选;针对每个中类,结合国际标准与自建语料库,通过关键词匹配、浅层语义匹配及深度语义模型进行小类语义相似度计算;最后整合语义权重与业务分析,输出推荐度最高的小类编码。装置包括中类判断模块、小类数据处理模块、多模态语义匹配模块及编码决策模块。有益效果:本发明通过分层分类策略与多模态语义融合,解决了复杂行业文本分类模糊、人工依赖度高的问题,显著提升了大规模数据处理的自动化水平。
技术关键词
BERT模型
编码方法
关键词
深度语义模型
语义匹配算法
文本
多模态
社会
数据分类技术
编码装置
训练语料集
业务规则库
综合语义
审核规则
语义层面
分类策略
分类器
数据处理模块
系统为您推荐了相关专利信息
多智能体协同
信息交互方法
工作流
应用程序编程接口
信息交互系统
评标方法
大语言模型
实体
解析工具
语义理解模型
分析方法
命名实体识别
颜色直方图
电力系统数据处理技术
HSV颜色空间
养老机器人
姿态识别模型
语音控制方法
语义意图
人体关键点