导读部分 返回列表
嘿,朋友们,今天咱聊点刺激的——Anthropic刚发的Fable 5模型,号称史上最强,结果一上来就给自己上了个“紧箍咒”:网络安全、生物学、化学这些话题,它直接拒绝回答!这操作,像不像你妈把路由器...
正文内容
嘿,朋友们,今天咱聊点刺激的——Anthropic刚发的Fable 5模型,号称史上最强,结果一上来就给自己上了个“紧箍咒”:网络安全、生物学、化学这些话题,它直接拒绝回答!这操作,像不像你妈把路由器藏起来不让你熬夜打游戏?
事情是这样的:Anthropic在6月10号正式发布了Claude Fable 5,按照官方的说法,这货的智能水平超越了以前的Opus系列,是“Mythos级”的新标杆。但你猜怎么着?他们害怕这模型被坏人利用,于是对某些敏感话题开启了“静音模式”。对,你没听错,一个AI竟然学会了“装死”。

咱们先来拆解一下这个“怂”背后的逻辑。Anthropic在安全文档里明确表示:Fable 5在网络安全(cybersecurity)、生物学(biology)和化学(chemistry)三类问题上会直接拒绝回答。为啥?因为他们担心这模型如果太能干,可能会“助力”一些坏蛋搞破坏。比如教你怎么黑进别人系统、怎么合成危险化学品——这些内容,AI现在连讨论都不准讨论。
这就引出了一个问题:AI到底该不该有“禁区”?你看,前阵子Google的Gemini也是各种限制,甚至闹出了“政治正确过头”的笑话。 Anthropic这次倒是没搞政治敏感,而是瞄准了实操性强的危险领域。我个人觉得,这其实比完全不管要强。你想啊,如果一个模型什么都能回答,那随便一个人都能用它来制造麻烦,这不等于把核按钮交给三岁小孩吗?

不过,也有网友吐槽:“限制这些话题,等于让一个赛车手不准踩油门,那还比个毛线?”确实,Fable 5在数学、编程、创意写作这些领域表现炸裂,但在安全限制下,它的实用性打了不少折扣。比如你想让它帮你分析一下最新的网络漏洞报告——它直接回你一句“抱歉,我无法回答”。这就尴尬了。
那么,这种“选择性失明”的做法到底有没有用?从Anthropic公开的评估数据看,Fable 5在“有害回答率”上确实控制得很好,只有0.3%的漏网之鱼。但代价是它在某些专业领域的能力被强制阉割。这就像你为了保护孩子,不让他接触任何尖锐物品,结果他连水果都不会削了。
更搞笑的是,Anthropic还专门搞了一个“信任与安全系统”,用来监控模型会不会绕过这些限制。你说这是不是自己给自己找麻烦?明明可以靠技术迭代解决的问题,非得靠“封嘴”来应付。不过话说回来,作为一家负责任的AI公司,总比那些什么都不管、张口就来的模型要靠谱一点。
说到这儿,就不得不提咱们站内之前聊过的几篇文章:比如这篇Anthropic Fable 5震撼发布:一次提示词一键生成游戏,还有Anthropic 80%代码由Claude生成 企业开发者该如何应对,都是关于Anthropic的深度分析。看完你就会发现,这家公司真的是在安全与能力之间疯狂试探。
总结一下:Fable 5就像是一个学霸,但学校给他戴上了一副“道德眼镜”,让他看到某些题目就自动闭眼。对你我这些普通用户来说,其实影响不大——毕竟我们也不会天天问“怎么制造炸弹”。但对于安全研究人员、生物科技从业者来说,这限制可能有点头疼。
最后,咱得想想:AI的“安全”到底该由谁来定义?是公司拍脑袋,还是用户投票?或许未来我们会看到更智能的方案——比如让模型根据提问者的身份和意图动态调整权限。但至少在目前,Anthropic选择了一条最保守的路。你们觉得呢?欢迎在评论区开喷!
本文出自 AI一族,原文链接:https://www.aiyizu.cn/?p=3891
转发请注明出处,禁止未经允许用于任何商业用途。