摘要
本发明公开了一种利用双向循环神经网络(BiLSTM)评估软件代码标识符与相关自然语言描述之间语义相似度的方法和系统。该方法通过构建共享权重的孪生BiLSTM网络模型,将代码标识符和描述分别输入并进行特征提取,然后组合提取到的特征向量,通过全连接层预测语义相似度得分。该系统包括数据处理单元、模型训练单元和相似度预测单元,实现了对代码标识符和注释之间一致性的自动化评估。本发明解决了传统文本相似度评估方法在处理代码领域专业文本时的局限性,提高了代码文档质量,增强了软件的可维护性和可理解性。通过在文本相似度数据集上的实验,验证了该方法的有效性,并预期在代码标识符与注释的特定领域数据上进行训练和微调后,能够获得针对性的高性能表现。
技术关键词
标识符
生成上下文感知
序列
神经网络模型
自然语言
文本
语义
数据处理单元
sigmoid函数
度评估方法
更新模型参数
软件
算法
标签
有效性
高性能
列表
系统为您推荐了相关专利信息
优化调度方法
变量
时间序列预测模型
负荷
时间段
预测系统
决策树模型
逻辑回归模型
地理位置特征
滑动窗口
探伤检测方法
碳素钢棒材
超声波回波信号
识别标签
生成声场
混凝土坍落度
统计特征
速率
混凝土浇筑现场
覆盖混凝土表面
惯容器
激光位移传感器
阻尼
线性弹簧
参数识别方法