摘要
本发明公开了基于关键词提取的直播弹幕数据爬取处理系统,实时爬取直播间弹幕,并进行预处理,监听网关服务的弹幕广播,根据所述弹幕广播获取用户端发送的弹幕数据,采集直播过程中的弹幕问题信息,所述弹幕问题信息包括:观众会话I D、弹幕发送时间以及弹幕内容。本发明通过动态调整分析时间间隔并基于观众会话I D识别新观众及其提问意图,本发明能够确保新观众的提问得到及时响应。
技术关键词
直播弹幕
弹幕数据
意图分类模型
关键词
监听网关
LDA主题模型
定时器
BERT模型
意图类别
动态
分词
语句
插件
解密
加密
标签
系统为您推荐了相关专利信息
门控循环网络
词嵌入向量
实体关系分类方法
权重算法
实体关系分类装置
关键词提取技术
分布式文件系统
数据分析程序
数据分析方法
元素