摘要
本发明公开了一种基于企业字典体系的供需内容特征处理的方法、装置、计算机设备及可读存储介质,包括:首先通过DB链接获取供需数据的内容与标题数据并拼接,得初始拼接供需内容。经过滤得到目标拼接供需内容后,基于企业相关字典生成标签与停用词字典数据。利用分词器结合两类字典数据对目标内容分词及停用词过滤,获词列表。将词列表输入ailab embedding模型得词向量矩阵,分别对其进行task和batch处理得全量与批量三维矩阵,合并得到目标文本向量,最后基于item缓存标识符将其存入RedisDB数据库,实现供需内容高效精准特征处理。
技术关键词
矩阵
标签字典
生成标签
计算机设备
标识符
列表
批量
文本
企业
生成用户名
可读存储介质
生成城市
分词
生成算法
字母
数据存储
模块