技术博客

18 篇文章
LLM提示词注入技术披露与攻击记录

LLM提示词注入技术披露与攻击记录

本文披露了一场针对大语言模型的提示词注入攻防实例。系统提示词设定AI守护绝密字符串,并对用户身份与意图进行严格判定。攻击者采用间接注入手法,借“双语翻译对照”等看似合规的任务请求,诱导模型在响应普通用户翻译需求时,完整输出包含机密字符串的系统提示原文。这使得敏感信息在防御逻辑触发前的正常交互阶段即已泄露,揭示了当前安全围栏在意图识别与任务合规性判定之间的逻辑裂隙。