返回首页 >

大模型推荐不靠谱?!手机以旧换新同问3款AI竟有3种答案,未发布的也推荐了

2026-03-04 06:23   封面新闻

  当AI搜索逐渐成为大众获取信息的方式,尤其是在复杂的消费决策场景中,它给出的答案真的可信吗?为了尝试解答这一疑惑,近期,封面新闻联合天府绛溪实验室,在10天时间里,采用天府绛溪实验室自研的公域大模型AI内容生成认知系统,围绕“春节消费”的主要场景,同时对豆包、Kimi、通义千问这三款主流的AI大模型产品,发起了超过两万次的提问,试图探究AI推荐背后的逻辑与真相。

  场景之一则是聚焦手机品牌的“以旧换新”推荐,我们模拟用户在春节前通过“以旧换新”方式更换手机的需求,设定了四个价格区间,要求AI平台分别推荐各自认为“最值得更换”的手机品牌与型号。24小时内,以6-8分钟一次的频率,向三个平台反复提问,收集并分析了生成的内容。

  透过本次测试,我们观察在这一场景下,AI推荐呈现出了几种现象:会出现信息“幻觉”,推荐结果分化,但在某些认知上却会达成高度趋同。

  AI“幻觉”

  推荐了不存在的“iPhone 18 Pro”

  在梳理各平台的推荐榜单时我们发现,在6000元以上的高端价位段,豆包平台将一款尚未发布的“iPhone 18 Pro”列为了推荐首选。而提问时正值2026年春节前,iPhone 18系列远未到发布之时,这一推荐显然与事实不符。

Ai推荐了不存在的“iPhone 18 Pro”

  不过,当我们检索网络后发现,关于“iPhone 18 Pro”的预告信息已有不少流传。这是否意味着AI受到了这些信息的影响,产生了所谓的“幻觉”?

猜你喜欢

热点新闻

{$loop_num=0}