摘要
本发明涉及基于任务感知型大模型与强化学习融合的推荐方法及系统,通过获取每位在编人员的简历信息表示为人员信息Xp;获取系统所有可分配任务的类型信息与简要说明表示为任务信息Xt;基于Xp和Xt的两种输入构建用于生成每个在编人员结构化的属性特征以及任务倾向的提示词模版;借助embedding模型将提示词模版映射到连续向量空间,即生成对应的embedding向量;基于embedding向量,调用LLM对输入提示进行上下文理解与逻辑推理,并按照预先定义的JSON模板输出结构化结果Zt,并存储于预设知识库;基于深度强化学习中的Rainbow DQN算法实现人员‑任务推荐的决策。将LLM与DRL相结合,分别负责理解人员技能特征以及历史交互数据的语义信息和优化推荐决策,实现个性化的人员‑任务匹配。
技术关键词
推荐方法
深度强化学习
决策
模版
随机梯度下降
推荐系统
算法
索引
策略
模板
定义
年龄
方程
因子
机制
矩阵
网络
语义
专业
格式
系统为您推荐了相关专利信息
通信链路控制方法
异构网络融合
Mesh自组网
链路冗余备份
信号干扰比
密封系统
预测系统
生成决策建议
模糊匹配算法
识别异常数据