摘要
本申请公开了一种象形文字词组释义的挖掘方法、装置、设备、介质及产品。该象形文字词组释义的挖掘方法包括:通过Transformer模型确定语料库中象形文字的字间概率分布,并根据字间概率分布确定候选词组;对于每个所述候选词组,确定所述候选词组对应的图像片段以及所述候选词组对应的单句释义文本;通过图文对齐模型,确定所述候选词组在所述单句释义文本中所对应的分词,得到所述候选词组对应的释义。上述技术方案根据字间概率分布确定候选词组,并利用图文对齐模型从相应的单句释义文本中匹配候选词组对应的分词,得到候选词组的释义,实现了对于象形文字词组释义有效和准确的挖掘。
技术关键词
挖掘方法
分词
文本
图文
图像
注意力机制
前馈神经网络
掩码策略
挖掘装置
计算机程序产品
处理器通信
可读存储介质
存储器
样本
电子设备
模块
指令
系统为您推荐了相关专利信息
全景影像序列
导游系统
特征点集合
沉浸式显示装置
关键点
掩码矩阵
依存句法分析
气象预测技术
节点特征
文本