摘要
本发明涉及数据分析技术领域,具体涉及一种海量信贷短信的关键信息自动抽取分析方法。该方法通过预设语义标签替换短信文本中的特定信息,并对短信文本进行分词及向量化处理,获得结构化文本表征;根据语义单元内各分词与对应预设语义标签、模板语义锚点,确定语义锚点特征指标;筛选出目标语义锚点;针对各语义分析窗口,根据窗口内目标语义锚点的数量及语义锚点特征指标,确定语义描述强度;根据窗口内目标语义锚点与模板语义锚点的语义差异特性,确定模板相似度;根据语义描述强度与模板相似度,确定窗口的区域注意力权重;将各文本切片的词向量与对应区域注意力权重输入预训练语言模型,输出文本关键信息,由此,提升关键信息准确率。
技术关键词
语义标签
分词
锚点
文本关键信息
分析方法
模板
短信
预训练语言模型
注意力
指标
阿拉伯数字形式
切片
序列
数据分析技术
元素
强度
列表
关系
系统为您推荐了相关专利信息
储能变流器
生成对抗网络模型
滑动窗口方法
检测模型训练
长短期记忆网络
一维卷积神经网络
麦冬药材
识别方法
红外光谱仪
非暂态计算机可读存储介质
石榴
模块化系统
标准溶液
交叉验证方法
输入设备
融合分析方法
卫星遥感数据
环流模型
气象灾害风险
海洋气象要素
测试设备
风洞测试系统
风量调节装置
高效率
腔体