摘要
本发明公开了一种基于NLP的游客弹幕情感分析与内容生成方法,涉及弹幕情感分析领域,通过对原始弹幕文本进行BERT深度分词,提取词序列、表情符号、标点串序列、重复字符串;构建词汇、副语言、时间三通道特征向量,通过多头注意力机制生成融合特征向量;利用广义可加混合模型结合三次样条基函数计算情感概率,输出情感分类标签;通过多维度特征融合与概率校准,有效捕捉弹幕中语义、副语言符号及时序波动的深层关联,解决了传统方法对副语言信息和时序特征利用不足的问题,提升了情感概率计算精度,降低了边界样本误判率。
技术关键词
内容生成方法
滑动时间窗口
Morlet小波变换
多头注意力机制
序列
文本
情感词典
编码向量
信息熵
正弦余弦函数
广义
词嵌入向量
弹幕数据
密度
分词
强度
训练集
标签
字符