一种新闻内容核心导向标注方法、设备及介质

正文

推荐专利

申请号：CN202510948263

申请日期：2025-07-10

公开号：CN120470127B

公开日期：2025-11-14

类型：发明专利

摘要

本申请公开了一种新闻内容核心导向标注方法、设备及介质，涉及电数字数据处理技术领域。方法包括：将预设的新闻文本数据集划分为已标注文本示例池和未标注文本数据集；对未标注文本数据集进行初步标注，得到弱标注文本数据集；从弱标注文本数据集中筛选目标置信样本，并通过预设的筛选策略，基于目标置信样本，生成带有目标伪标签的目标样本集合；并根据语义近邻样本构建对话提示模板，以基于预设的macBERT模型，通过对话提示模板，输出弱标注文本数据集对应的精炼伪标签；将目标样本集合和待精炼文本作为训练集输入到macBERT模型中进行训练，得到训练完成的文本分类模型，并通过文本分类模型，输出待标注新闻的核心导向标注。

技术关键词

样本标注方法标签文本分类模型高斯混合模型数据核心语义非易失性计算机存储介质计算机可执行指令模板标注设备训练集代表处理器通信策略分阶段

系统为您推荐了相关专利信息

一种基于小样本学习的食品安全风险评估的方法

食品安全风险评估样本粮油食品原型注意力机制

一种针对职业技能评估的语音输入测评方法、装置、计算机设备及可读存储介质

同义词分词文本语音识别模型关键词

一种模型训练方法和相关装置

图像特征向量训练样本集医学模型训练方法标签

一种基于大数据的AI智能营销系统及其方法

AI大数据智能营销系统数据采集模块生成系统视频采集模块

一种基于RAG技术的母婴产品情感营销策略优化方法

营销策略优化方法文本数据采集模块大语言模型分析模块

一种新闻内容核心导向标注方法、设备及介质

站点导航

APP 下载