摘要
本发明公开了基于语义的关键词自动推荐方法及系统,属于机器学习技术领域,要解决的技术问题为:如何高效、准确地实现关键词自动推荐任务。包括:对文本数据进行分词处理,向第一分词数据集中增补未记录词语以及未记录词语对应的词性和统计数据,将已记录词语以及对应的TF‑IDF数值记录至第二分词数据集;通过二分搜索法和主次因素分析法从第二分词数据集中筛选可用关键词;通过词嵌入模型对关键词词表中关键词进行编码,将关键词以及对应的编码向量增补至向量数据库的关键词集合中;基于给定词语对应的编码向量、通过向量相似搜索的方式从向量数据库的关键词集合中检索相似度匹配的关键词。
技术关键词
词语
编码向量
文本
词嵌入模型
推荐方法
关键词推荐
数值
推荐系统
搜索算法
语义
数据处理模块
停用词表
分词算法
噪声数据
编码模块
脚本
系统为您推荐了相关专利信息
医疗问答系统
数据处理模型
计算机可读取存储介质
数据处理方法
数据处理设备
AI语音
交互测试方法
智能座舱
交互系统
智能模型