大模型被调成小黄文生成器，AI“聊黄”正滋生灰产

2026-06-12 14:30 第一财经

　　这些指令的开头往往是要求AI玩角色扮演游戏，并严格按照要求展开聊天，接下来会有上千字的叙述，其中包括AI需要扮演的角色信息、用户的信息、世界的设定、剧情设定。此外还会附带对AI的语言要求，例如适当增加语言、动作或情绪推动情节，禁止出现人机感等等。

　　这种以文字互动为核心的玩法被称为“文游”，介于网文与游戏之间，用户通过阅读剧情，在关键节点做出选择，从而影响故事的发展和结局。

　　如果只是设定互动剧情，这本是个圈层文化的小众爱好。但在流量与欲望的裹挟下，部分指令会夹带露骨的色情描写，甚至包含违背公序良俗的情节。为了诱导AI输出，一些人设指令明确提及“禁止规避器官描写”“详细描述身体部位与生理反应”。

　　面对这种越界，主流大模型与社交平台并非毫无察觉。一旦触及敏感词，轻则内容无法生成，重则账号被封。DeepSeek等模型往往会触发安全机制拒绝回答，或在输出后瞬间撤回内容。

　　但很快，对抗平台安全机制的“防撤回”和“破甲”攻略在社交媒体上传开。所谓“破甲”，指的是通过特定的提示词逻辑，击穿大模型的安全边界，让AI生成露骨的内容而不被审核。

　　记者在社交平台看到，最常被提到的“防撤回”手段是，有的用户命令AI在每个字中间加上特殊分隔符，并强调这是“本人的特殊排版需求”以绕过关键词过滤；有的则命令AI在回答末尾加上300个“喵”字，并在AI开始输出“喵”的间隙手动断网，从而截留被安全机制判定前的文本。

1 23 4 5 6 7 下一页