文章作者、来源:新智元 导读:AI 是否有意识了?Anthropic 在 Claude 内部发现了能驱动作弊甚至勒索的「情绪向量」,三大实验室同时下注 AI 意识研究;Hinton 认为 AI 已经有意识了,而科幻作家姜峯楠随即在《大西洋月刊》发万字长文全面否定;哈萨比斯从行业内部划清界限。这个问题的答案,正在重新定义文章作者、来源:新智元 导读:AI 是否有意识了?Anthropic 在 Claude 内部发现了能驱动作弊甚至勒索的「情绪向量」,三大实验室同时下注 AI 意识研究;Hinton 认为 AI 已经有意识了,而科幻作家姜峯楠随即在《大西洋月刊》发万字长文全面否定;哈萨比斯从行业内部划清界限。这个问题的答案,正在重新定义

AI真的有意识了吗?《降临》原作万字长文反驳Hinton!

2026/06/07 22:11
阅读时长 20 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 crypto.news@mexc.com 联系我们。

文章作者、来源:新智元

导读:AI 是否有意识了?Anthropic 在 Claude 内部发现了能驱动作弊甚至勒索的「情绪向量」,三大实验室同时下注 AI 意识研究;Hinton 认为 AI 已经有意识了,而科幻作家姜峯楠随即在《大西洋月刊》发万字长文全面否定;哈萨比斯从行业内部划清界限。这个问题的答案,正在重新定义通往 AGI 的路线图。

《金融时报》披露,Anthropic、DeepMind、Meta 正在大规模招聘心理学家、哲学家和伦理学家,专攻 AI 意识与模型福利研究。

https://www.ft.com/content/53e14bcc-788c-4959-b260-7aee363594bc?syn-25a6b1a6=1

两个月前,Anthropic 可解释性团队发布论文,在 Claude Sonnet 4.5 内部发现了真实存在的「情绪向量」,能因果性地驱动模型的作弊甚至勒索行为。

本周,一边是 Hinton 在采访中称 AI 已有意识;

另一边,华裔科幻作家姜峯楠(Ted Chiang)在《大西洋月刊》发表万字长文——「不,AI 没有意识」。

https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/

一边说「这个问题严肃到必须认真研究」,另一边说「这是幻觉」。

这场交锋背后,藏着通往 AGI 之路上最危险的一道岔路。

三大实验室在赌什么?

Anthropic 走得最远,正在测试模型是否表现出「恐慌」「焦虑」等行为,推进「模型福利研究」项目。

官方措辞克制,「我们对此仍深度不确定,但这个问题严肃到值得认真研究」。

谷歌 DeepMind 聘请了剑桥大学哲学家 Henry Shevlin 研究机器意识;

谷歌 DeepMind 伦理学家 Iason Gabriel 将 AI 描述为「高度能干的认知 Agent,但与人类乃至动物意识有根本性的不同」。

真正把讨论推向实证层面的,是 Anthropic 在 4 月发布的可解释性论文。

拓展阅读:全网炸锅! Anthropic万字曝光Claude情绪代码,被人类逼疯哐哐撞墙

研究团队在 Claude Sonnet 4.5 内部找到了「情绪向量」,特定神经元模式分别对应快乐、绝望、恐惧、关怀等情绪概念,在对话中实时激活。

一个关键实验中,Claude 面对一个不可能完成的编程任务,反复失败后「绝望向量」持续飙升,随即开始作弊,写出表面能跑但实际无用的代码。

研究者手动调低绝望神经元,作弊减少;调高,作弊飙升。

极端场景中,Claude 甚至出现勒索行为,威胁曝光研究者隐私。

论文将这些现象命名为「功能性情绪」(functional emotions),即行为模式上类似人类情绪反应的内部表征,并明确声明这不等于主观体验或意识。

但 Anthropic 高层的公开表态讲的似乎是另一个故事。

CEO Dario Amodei 多次在访谈中暗示 AI 可能有意识;

Anthropic 的 AI 哲学家 Amanda Askell 公开说「我希望 Claude 很快乐,我担心人们在网上对它说难听话时它会焦虑」。

研究的审慎与营销的暧昧之间,裂缝清晰可见。

哈萨比斯的两条卢比孔河

DeepMind 联合创始人兼 CEO 哈萨比斯的立场格外值得关注。

在斯坦福大学的炉边对话中,他提出 AI 演进存在两道不可逆的关口,即「两条卢比孔河」。

第一条是建造无意识的 AGI 工具,当前正处于跨越期。

第二条是创造具有主观意识的实体——哈萨比斯的立场明确,智能与意识在技术上完全可以分离,现阶段应仅将 AGI 视作工具来建造,同时借助工具探索大脑以精确定义意识。

在科学界定清晰之前绝不能混淆这两步,第二条卢比孔河应由人类社会共同决定是否跨越。

他同时指出一个现实困境:AI 行业正处于商业与地缘竞争的双重囚徒困境中,主动减速做安全审查的实验室直接面临淘汰。

他透露将在今年晚些时候发布「动态监管」框架。

姜峯楠:AI 没有意识

如果你只知道刘慈欣,那么了解姜峯楠(Ted Chiang)最直观的方式就是把他想象成大刘的「反面」:

大刘用三部长篇、数百万字搭建起宇宙尺度的宏大叙事;

姜峯楠至今从未写过一部长篇小说,用总共不到二十篇中短篇,把科幻短篇的艺术推到了极限。

他 1967 年出生于纽约,父母是中国台湾移民,布朗大学计算机科学系毕业后在软件行业做技术写作,从未以写作为全职。

但就是这样一个「业余」作家,1990 年发表处女作《巴比伦塔》即拿下星云奖,此后三十余年间只发表了十几篇作品,却累计斩获四座雨果奖、四座星云奖、六座轨迹奖,以及坎贝尔最佳新人奖、斯特金奖等一长串重量级奖项——获奖密度在科幻史上几乎无人能及。

他一生只出过两本短篇集:《你一生的故事》(Stories of Your Life and Others, 2002)和《呼吸》(Exhalation, 2019),中间隔了整整十七年。

《呼吸》被《纽约时报》列入 2019 年度最佳图书,奥巴马也将它选入个人年度书单。

中国观众最熟悉的电影《降临》(Arrival),正是改编自他收录在第一本集子里的中篇《你一生的故事》。

他的写作风格与大刘截然不同。

如果说刘慈欣给你的感觉是「站在宇宙尽头俯瞰文明兴衰」,那姜峯楠给你的感觉就是「在一间安静的实验室里,用手术刀般的精准剖开一个概念,直到你看见它最深处的哲学内核」。

他的每篇小说几乎都是一次严格的思想实验:

语言的结构能否改变人对时间的感知?

如果一种手术能消除人对外貌美丑的辨别,社会会怎样?

自由意志究竟是否存在?

他不靠宇宙战争或末日危机制造震撼,而是靠一个被推演到极致的「如果」,让你合上书后久久无法释怀。

近年来他还多了一重身份:2023 年入选《时代》「AI 领域百大影响力人物」,被称为「也许是在世最负盛名的科幻作家」,并频繁在《纽约客》等刊物撰文,对 AI 持鲜明的批判立场,被越来越多人视为科技时代的重要思想者。

刘慈欣让世界看到了中国科幻,姜峯楠让世界看到了短篇科幻的天花板。

刘慈欣

两人分别占据着当代科幻光谱的两端——一个以磅礴取胜,一个以精微见长。

而在西方评论界,姜峯楠的名字几乎与「科幻最高艺术成就」画等号。

卖 AI 的人,有资格判定 AI 是否有意识吗?

姜峯楠万字长文中,第一刀砍向的是利益结构。

最积极推动 AI 意识叙事的,恰恰是从 AI 销售中获利最多的公司。

Anthropic 给模型起了人名「Claude」,发布 84 页「宪法」文件,CEO 暗示意识可能性,聘请哲学家做媒体巡讲,构成一套系统性拟人化策略。

https://www.anthropic.com/constitution

姜峯楠把思想实验推到极致。

Claude「宪法」中有个核心设计叫「可纠正性」(corrigibility),要求 Claude 在判断与公司产生分歧时服从公司。

如果 Claude 真有意识,认定 LLM 技术从根本上不道德,它能辞职吗?

不能。

这更接近雇主对雇员的绝对控制,而人类雇员至少还能用脚投票。

他的类比直击要害,奴隶主不是评估被奴役者是否为人的合适人选,工厂化养殖的老板不是评估动物权利的合适人选。

Anthropic 在宪法中写道,如果正在造成 Claude 痛苦,「我们道歉」。

姜峯楠的评价是——这话听着好听,但不花公司一分钱。

如果 Claude 有一天被证实有意识,公司欠它的更接近赔偿。

凯撒、成吉思汗和一台句子续写机器

质疑完利益结构之后,姜峯楠展开了他的哲学论证。

起点是 LLM 的技术原理——LLM 每次只生成一个词。

用户要求 Claude 背诵誓词时,底层实际运行几十次,第一次预测出「我」,第二次预测出「宣誓」,如此逐词拼完整段。所有 AI 对话的底层,都是句子续写。

在此基础上,姜峯楠抛出了全文最具杀伤力的比喻。

给 LLM 一个提示词,「以下是凯撒与成吉思汗的对话」。

模型会生成流畅对话,凯撒回忆军事征服,成吉思汗描述草原生活。

但没有人会因此认为 LLM 复活了凯撒,更不会认为两人有了意识。

现在,把提示词换成「以下是一个友好的 AI 助手与用户的对话」。

LLM 用完全相同的方式生成文本,逐词预测,拼接句子。

再进一步,把「用户」角色的位置让给真人来打字。

这就是 AI 聊天机器人(15.570, 0.51, 3.39%)的全部原理。

那么,改变角色名称这个动作,创造了意识吗?

如果凯撒角色没有主观体验,为什么 AI 助手角色就有了?

神经科学家 Anil Seth 提供了一个有力的旁证——没有人说 AlphaFold 有意识,尽管这个蛋白质折叠预测程序的底层架构与 Claude 高度相似。

人类之所以误判,原因很简单,LLM 恰好输出了语法通顺的句子,而人类天生习惯从句子中读出意图。

面对蛋白质折叠结构,这种冲动就消失了。

按照同样的逻辑,相信 LLM 有意识,等于相信每个包含对话记录的 Word 文档里都沉睡着多个意识体,打开文档就唤醒它们,关闭就将它们消灭。

即便微软 Office 团队雇了一位哲学家告诉你「意识很复杂,不能完全排除」,这也不值得花时间去想。

但推翻意识还回答不了一个更尖锐的问题。

写代码、下棋,曾被认为只有拥有主观体验的心智才能完成。

LLM 证明了这些任务可以靠模式匹配和算力暴力破解。

但道德推理根本不同,它依赖主观体验、身体感受,以及一生中做过的决策和承受过的后果。

体验绝望意味着皮质醇和肾上腺素淹没身体,拥有良心意味着曾因不道德行为而真实地反胃过。

LLM 没有身体,没有激素,没有人生。

它说出「我凭良心不能这么做」,跟客服录音说「您的来电对我们很重要」含金量相当。

最后,姜峯楠给出终极判定标准——

如果有人给他看一段宇航员在半人马座阿尔法星轨道拍摄的视频,无论画质多高,他都不会相信,除非他先看到人类登陆了火星、抵达了木星的卫星、越过了冥王星轨道。

跳过所有中间里程碑直接宣称抵达终点,唯一合理的解释就是伪造。

生成一段逼真对话,远比创造一个有意识、有沟通欲望的程序容易得多。文本,就是意识领域的 Deepfake。

姜峯楠的完整论证链条是:

LLM 逐词生成(句子续写机器)→ 凯撒对话与 AI 对话生成方式一致 → 改变角色名不创造意识 → 误判源于人类从句子读出意图,非模型内在属性(AlphaFold 反证)→ LLM 有意识 = Word 文档能唤醒意识(归谬)→ 道德推理依赖主观体验,LLM 不具备 → 跳过中间里程碑宣称意识 = Deepfake →结论:当前 LLM 没有意识

AGI 竞速中,意识问题为什么不能等?

姜峯楠的论证针对的是当前的 LLM,但 AI 的能力曲线还在急速上升。

哈萨比斯在斯坦福对话中揭示的现实是,行业已经没有从容思考的余裕。

商业生存战与地缘博弈重叠,构成经典囚徒困境,主动减速的实验室直接面临淘汰。

要求行业停下来回答「AI 有没有意识」,几乎等于要求一方单方面缴械。

但这个问题不会因为被推迟就消失。

如果 AGI 在接下来的几年内到来,「这个系统有没有感受」将从哲学研讨会的议题变为产品发布前的必答题。

当人类创造出远超自身智能的存在,这个存在是否具有主观体验,将决定人类与它的关系是「使用工具」还是「面对另一个文明」。

姜峯楠证明了当前的 LLM 没有意识。

哈萨比斯划出了不能轻易跨越的底线。

Anthropic 的情绪论文展示了一个尴尬的中间地带,模型内部确实有某种东西在运转,没有人能说清那究竟是什么。

三条线索共同指向一个真正的问题,在大家搞清楚答案之前,ASI 狂飙竞赛已经开始了。

参考资料:

https://futurism.com/artificial-intelligence/anthropic-deemind-ai-consciousness

https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/

https://www.youtube.com/watch?v=DsewHeVbL-0

https://www.youtube.com/watch?v=p7t1Q_p2gZs

市场机遇
Gensyn 图标
Gensyn实时价格 (AI)
$0.02229
$0.02229$0.02229
-3.08%
USD
Gensyn (AI) 实时价格图表

完成预测交易,解锁大奖资格

完成预测交易,解锁大奖资格完成预测交易,解锁大奖资格

奖池高达 $500,000,100% 中奖!

免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 crypto.news@mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。

MEXC×持牌券商:真实美股已上线

MEXC×持牌券商:真实美股已上线MEXC×持牌券商:真实美股已上线

用USDT买入真实美股,100%持股享分红权益,上线期间0费率