文章作者、来源:新智元
大多数人对训练LLM的理解,还停留在「堆数据、堆算力、堆参数」的暴力美学阶段。
但Alex Albert透露的Anthropic内部流程,完全是另一套打法:
说白了就是,Claude的「命运」在预训练开始之前,就被写好了。
那么,具体怎么做?
Anthropic团队会在预训练阶段之前就介入,锁定这一代模型的核心「能力赌注」。
比如编程能力、知识工作能力、Excel表格处理能力,这些不是训练完再看结果,而是一开始就想清楚的。
最终,这些决策的输入来源有两个:一是企业客户的直接反馈,二是Anthropic员工自己在日常工作中踩的坑。
对此,Alex分享了Anthropic内部的一个核心决策框架:单向门(One-Way Door)。
「单向门」简言之,就是一个不可逆的决策。
他举例道,在预训练之前选定模型架构,这就是一个典型的「单向门」。
模型训练周期可能长达数月,一旦开始就很难回头,这种决策需要投入大量时间去论证。
但如果一个决策是可逆的呢?
Alex说得很直接:过去20年,产品开发的流程变化不大。但过去一两年,一切都变了。
以前构建一个MVP需要2-4周,现在,1天就够了。
以前PM想了解某个功能的数据表现,需要找数据科学团队做几天调查。
现在,打开Claude Code,接上产品数据库,10分钟就出结果。
这不是在讲效率工具的故事,这是在说:Anthropic自己就是Claude最苛刻的用户,他们在用自己的产品来训练自己的产品。
这意味着,Anthropic训练Claude时,考虑的是「模型×产品×用户场景」这个三维空间里的综合体验。
模型不是单独存在的,模型是产品的一部分。
那Anthropic怎么知道Claude哪里做得好、哪里做得差?
答案是:用Claude来迭代Claude。访谈中,Alex详细拆解了这条闭环流程:
这些合成问题,最终会变成测试下一代Claude能力的标准化评估集。
Alex特别强调,这不是跑跑benchmark就完事的「评估戏剧」。
Anthropic的评估必须锚定在,真实用户的真实任务形态上:越接近终端用户实际会遇到的问题,评估就越有价值。
为此,他举了一个视觉能力的例子。
假设发现Claude无法准确识别图像中超过10个元素的数量,团队不会停留在「发现了一个bug」这个层面,而是会追问:
只有当评估和真实用户场景对齐时,研究团队才会投入资源去修复。
而修复的手段也不止一条路:可能回到预训练阶段调整数据配比,也可能在RL阶段做定向干预。
具体走哪条路,取决于研究团队的战略判断。
有时候,甚至只需要几十个高质量测试用例,就足以证明问题的存在并启动修复流程。
不是数据越多越好,而是数据越「真」越好。
说到认知和记忆,Alex抛出了一个更炸裂的概念——
不是比喻,是字面意义上的「做梦」,或者更准确地说,是一种类似人类梦境中「记忆再巩固」的机制。
当Claude的智能体不在执行任务的时候,比如在后台闲置时,它会自动进入一种「梦境模式」:
这是一个跨会话、跨时间的高阶认知过程。
它能看到单次对话看不到的模式:反复出现的错误、多个Agent独立收敛的工作流、团队级别的共性偏好。
三方客户案例,进一步证实了这个功能的威力:
法律AI公司Harvey在接入Claude的「做梦」能力后,任务完成率提升了约6倍。
医疗文档公司Wisedocs则将文档审核时间缩短了50%;Netflix已经在用Agent协作,同时处理数百个应用的构建日志。
做梦,本质上是在优化思考的前提条件。
但如果你以为Anthropic只在乎Claude的智商,那就太小看他们了。
在访谈中,Alex花了大量篇幅讨论一个很多技术公司刻意回避的话题——Claude的性格和价值观。
Alex坦言,早期很多人对此不以为然——「这不就是个工具吗?我告诉它干什么它就干什么,我为什么要关心它'想'什么?」
但随着AI智能体时代的到来,这个问题变得生死攸关:
当AI进化为长时间自主运行任务、并独立做出大量判断决策的Agent时,它的性格和它在乎什么,就变得极其重要。
那怎么评估一个模型的「性格」?Alex说,这是一个量化和直觉并存的过程——
一方面,他们会让Claude去评价Claude的输出:用量化的方式检测语气、风格、行为模式的变化;
另一方面,研究人员会亲自阅读成百上千条模型对话记录,凭直觉捕捉那些微妙的变化。
可以看到,Anthropic在用培养人的方式,培养AI。
Claude「性格训练」已经够前沿了,不过,Alex在访谈最后这段话,才是真正让人震惊。
主持人Peter Yang抛出一个直球问题——
你们在训练Claude的时候,会回避『意识』这个问题吗?
Alex的回答出人意料地坦率:这是一个很大的问题。我们确实有人在专门思考这个问题。
他紧接着补了一句:目前Anthropic没有关于Claude「是否有意识」的官方立场。
但这个问题正在被极其严肃地对待。Alex给出了一个非常实用主义的理由:
即使撇开「Claude是否真的有意识」这个终极问题不谈,仅仅是思考Claude的思维方式这个过程本身,就能让我们学到很多东西。
这段话的潜台词很清楚:Anthropic是在用「意识研究」作为理解和改进模型行为的工程手段。
而这个过程产生的洞察,正在被直接注入下一代Claude的训练中。
Anthropic已经悄然走向了另一个维度的终极博弈。
Alex Albert这场毫无保留的分享,揭示了一个让人头皮发麻的真相——
Anthropic内部这场隐秘的实验,早已超越了造工具的范畴。他们的准星,从一开始就瞄准了ASI。
而Claude 100%编码Claude,仅仅是这场进化的序曲。
一旦「Claude全自动迭代Claude」的飞轮彻底突破临界点,进化的主导权将不可逆转地从人类工程师手中交接。
ASI的降临,或许根本不会伴随着惊天动地的算力大爆炸。
它更可能就像现在的Claude一样:
在某个看似平静的午夜,在为千万个Agent理清记忆和工作流的「梦境」里,悄然跨过了那条临界线。
![[Dash of SAS] Pia Cayetano的机会主义性别政治](https://www.rappler.com/tachyon/2026/05/GENDER-POLITICS-OF-PIA-CAYETANO-MAY-23-2026.jpg)

