摘要
本发明涉及文本处理技术领域,公开了一种基于人工智能的文本信息处理方法,通过引入多模态信息融合和优化语义向量的迭代更新机制,显著提升了铁路公文文本处理的准确性和鲁棒性。首先,本发明将现有预训练模型得到的初始语义向量作为第一初始语义向量,确保了词汇的基础语义表示已经具备较高的准确性。在此基础上,进一步考虑了铁路公文文本中的非文本信息,提取非文本信息的多模态特征向量,并通过多层感知机将多模态特征与第一初始语义向量进行深度融合,生成第二初始语义向量。这一过程不仅丰富了词汇的语义表示,还为模型提供了额外的上下文信息,使得模型能够更全面地理解文本内容,极大地提高了关键词提取的准确性。
技术关键词
语义向量
文本信息处理方法
实体
铁路
多模态信息融合
多层感知机
预训练语言模型
文本处理技术
关键词
构建知识图谱
节点
元素
预训练模型
模态特征
标签
鲁棒性
机制
系统为您推荐了相关专利信息
生成方法
节点
输入输出关系
定义
计算机程序产品
建筑暖通空调系统
故障诊断方法
设备运行数据
重构误差
动态故障检测
知识图谱构建方法
光学字符识别
隐私保护技术
多源异构数据
动态