摘要
本发明涉及语义映射技术领域,具体公开了一种基于人工智能和大数据的标准化语义映射方法及系统,包括:步骤S1:将历史待映射数据划分为各个语句段,将全部语义特征向量划分为若干类;将语义特征向量的总数超过所述数目阈值的一类记为高频类,并选出中心向量;步骤S2:逐个对比映射结果和中心映射结果的可替换词汇,获得中心映射结果的替换词;步骤S3:将高频类的中心向量、全部语义特征向量、中心映射结果与全部替换词进行存储,得到映射库,并得到若干拟映射结果;步骤S4:选取出中心向量与语义向量语义相似度最高的高频类,获取该高频类内与语义向量相似度最高的语义特征向量对应的拟映射结果,作为待映射语句段的映射结果。
技术关键词
语义映射方法
语义向量
高频类
语句
数据
语义映射系统
自然语言
符号
终点
分词
映射技术
夹角余弦
存储模块
列表
坐标