数据处理方法和装置

正文

推荐专利

数据处理方法和装置

申请号：CN202411840013

申请日期：2024-12-13

公开号：CN119721027B

公开日期：2025-11-14

类型：发明专利

摘要

本申请实施例提供一种数据处理方法和装置，涉及人工智能技术领域，包括：对获取的待预测文本进行分词获得待预测词序列；针对待预测词序列中的每个分词迭代处理，分别执行步骤：获得待预测词序列中的第一分词分别与预设词库中各预设分词的语义邻接概率，和第一分词与邻接的第二分词的原始邻接概率，若原始邻接概率小于概率阈值，基于预设筛选条件和第二分词，从预设词典中选出多个候选分词；将与候选分词匹配的预设分词的语义邻接概率作为候选邻接概率，并将最大的候选邻接概率对应的候选分词作为目标分词，采用目标分词替换待预测词序列中的第二分词；以获得最终的待预测文本的目标文本。以提高数据清洗准确性和效率。

技术关键词

分词序列标签文本语义注意力机制数据处理方法词典关系翻译工具数据处理装置处理单元人工智能技术无监督参数

系统为您推荐了相关专利信息

一种基于文本语义解读的配电网项目可研报告分析方法

报告分析方法配电网项目术语文本处理模型规则集

基于一致性与差异性解耦的多模态意图识别方法及系统

意图识别方法音频特征视频序列特征动态门控

一种面向需求响应的用户可调负荷评估方法及系统

面向需求响应可调负荷时序特征负荷预测模型电力信息处理技术

骶髂关节合成CT检查技术及其系统

CT检查技术深度学习神经网络模型深度学习模型边缘检测算法 CT检查系统

一种动态人脸表情的识别方法与系统

动态人脸彩色图像静态特征加权特征识别方法

数据处理方法和装置

站点导航

APP 下载