摘要
本发明涉及数据分析技术领域,公开了评论观点分析方法、装置、计算机设备及存储介质,本发明将增量评论数据拆分为增量短句,利用原有短句和增量短句之间的词向量相似关系进行第一次聚类,得到多个第一聚类簇并选取每个第一聚类簇中的核心句,实现了增量短句的部分聚类,提高处理效率。在第一次聚类后,利用大语言模型标注核心句的标签,避免前期对所有数据进行标注造成的计算资源浪费。然后,利用核心句的标签和之前存储的核心句聚类结果进行第二次聚类,基于句向量进行聚类合并具有复杂语法结构的评论。将第一次聚类和第二次聚类的结果进行合并,得到每个观点维度下的短句,实现了对增量数据的快速处理,减少计算资源消耗,提高计算速度。
技术关键词
聚类
核心
观点
标签
分析方法
计算机设备
数据分析技术
可读存储介质
大语言模型
语法结构
关系
分析装置
存储器
处理器
指令
模块
文本
摘要
系统为您推荐了相关专利信息
问答模型
问答方法
文本
阶段
非暂态计算机可读存储介质
车辆行驶轨迹
告警系统
告警方法
车辆行驶数据
速度
神经网络模型
视频识别
异常检测方法
检测设备
双向长短期记忆网络