摘要
本发明涉及人工智能领域,公开了一种基于大数据的文案语义识别系统及方法,该系统包括:数据采集模块从多种数据源收集文案数据,以设定时间间隔自动采集新数据,并对采集到的数据进行预处理,包括初步清洗,以去除重复数据及格式错误数据;所述数据源包括网页、社交媒体平台及文档数据库;大数据存储模块存储经初步清洗后的文案数据;语义识别模型训练模块利用存储于所述大数据存储模块中的数据训练语义识别模型;语义识别执行模块,与所述语义识别模型训练模块及大数据存储模块连接,使用训练好的语义识别模型对新输入的文案进行语义识别,输出识别结果,所述识别结果至少包括文案的主题分类、情感倾向判断、关键语义信息提取。
技术关键词
语义识别系统
识别模型训练
大数据
真实性验证
语义信息提取
社交媒体平台
数据存储模块
数据采集模块
规则集
语义识别方法
长短期记忆网络
格式
深度学习算法
上下文特征
模式
主题
系统为您推荐了相关专利信息
金融风险评估方法
大数据
随机森林模型
成分分析
特征值
桌面客户端
公共服务系统
企业
接口模块
流量控制算法
业务管理系统
贷款业务管理
风险
业务状态信息
指数
工业大数据
模态特征
多层注意力
多模态
掩码矩阵