摘要
本发明公开了一种多模态大模型的交互式生成内容控制方法,包括如下步骤:步骤一,输入多模态令牌x、二进制高亮掩码m、指导强度Y和缩放因子a,然后进行初始化;步骤二,生成常规和无条件输入上下文对;步骤三,调整注意力权重,以在推理过程中,通过调整高亮部分的注意力权重来实现对生成内容的控制;步骤四,进行注意力激活,用调整后的注意力掩码重新加权相关的注意力分数,使生成过程更加集中于高亮部分,进而完成对于交互式生成内容的控制。本发明的多模态大模型的交互式生成内容控制方法,通过在输入上下文中高亮特定的提示部分,实现用户对生成内容的交互式控制,提升生成结果的相关性和准确性。
技术关键词
内容控制方法
注意力
多模态
令牌
因子
强度
序列