返回首页 >

大模型被调成小黄文生成器,AI“聊黄”正滋生灰产

2026-06-12 14:30   第一财经

  这些指令的开头往往是要求AI玩角色扮演游戏,并严格按照要求展开聊天,接下来会有上千字的叙述,其中包括AI需要扮演的角色信息、用户的信息、世界的设定、剧情设定。此外还会附带对AI的语言要求,例如适当增加语言、动作或情绪推动情节,禁止出现人机感等等。

  这种以文字互动为核心的玩法被称为“文游”,介于网文与游戏之间,用户通过阅读剧情,在关键节点做出选择,从而影响故事的发展和结局。

  如果只是设定互动剧情,这本是个圈层文化的小众爱好。但在流量与欲望的裹挟下,部分指令会夹带露骨的色情描写,甚至包含违背公序良俗的情节。为了诱导AI输出,一些人设指令明确提及“禁止规避器官描写”“详细描述身体部位与生理反应”。

  面对这种越界,主流大模型与社交平台并非毫无察觉。一旦触及敏感词,轻则内容无法生成,重则账号被封。DeepSeek等模型往往会触发安全机制拒绝回答,或在输出后瞬间撤回内容。

  但很快,对抗平台安全机制的“防撤回”和“破甲”攻略在社交媒体上传开。所谓“破甲”,指的是通过特定的提示词逻辑,击穿大模型的安全边界,让AI生成露骨的内容而不被审核。

  记者在社交平台看到,最常被提到的“防撤回”手段是,有的用户命令AI在每个字中间加上特殊分隔符,并强调这是“本人的特殊排版需求”以绕过关键词过滤;有的则命令AI在回答末尾加上300个“喵”字,并在AI开始输出“喵”的间隙手动断网,从而截留被安全机制判定前的文本。

猜你喜欢

热点新闻

{$loop_num=0}