摘要
本发明公开了一种基于解释生成和多智能体投票的隐性仇恨语言检测方法,包括1)结合多角度设计的提示信息与网络评论的文本内容,构建大语言模型LLMs的输入;2)通过提示引导大语言模型LLMs生成解释性输出及类别标签;3)单个智能体执行多次,并基于自身多次结果进行内部投票,以确定该智能体的最终决策;4)通过外部投票汇总多个智能体的在步骤3)中内部投票结果,综合决策,最终确定给定网络评论文本的类别标签,完成隐性仇恨语言检测。本发明通过引导LLMs生成解释,以揭示网络评论背后的语境和隐含信息,从而区分隐性与显性仇恨语言。此外,设计了双层智能体投票策略,以降低LLMs的幻觉现象,并提升隐性仇恨语言检测的准确性与可靠性。
技术关键词
大语言模型
网络评论文本
标签
帖子
双层智能
主题
决策
多角度
话题
定义
答案
社交
意图
语句
色彩
身份
格式
策略