中文9
微小符号,巨大风险:探究大语言模型中的表情符号语义混淆问题
学习资料
Agent漏洞ASCII表情+3
作者: Weipeng Jiang等
发表时间:
论文首次系统定义“表情符号语义混淆”漏洞:LLM会把日常ASCII表情误判为代码符号并执行非预期危险操作。基于3757个用例对6个模型测试发现全部受影响,平均混淆率38.6%,超90%为语法正确但语义错误的静默失败,易导致删库删文件等严重后果,且可迁移到Agent,现有提示式防护基本无效。
浏览 学习资料 分类下的公开文章、摘要与延伸阅读。肖恩子的知识花园
中文论文首次系统定义“表情符号语义混淆”漏洞:LLM会把日常ASCII表情误判为代码符号并执行非预期危险操作。基于3757个用例对6个模型测试发现全部受影响,平均混淆率38.6%,超90%为语法正确但语义错误的静默失败,易导致删库删文件等严重后果,且可迁移到Agent,现有提示式防护基本无效。