文章来源:腾讯研究院
2026年的夏天,中文互联网圈出现了一个有趣的现象。日活(DAU)这把单一的尺子不那么好用了。当AI助手替用户去办事,Agent根本不需要打开我们的App,而是通过API、MCP、A2A、CLI等方式调用能力。APP打开次数变少了,是产品变差了,还是用户的事更高效地办成了?这把尺子已经分不清。
在硅谷,a16z的年度报告里直接写了一句话:屏幕时代终结。或许未来我们可以给日活换成了一个新概念:任务完成率TCR(TaskCompletionRate)。它衡量的不是用户打开你的产品几次,而是用户交给Agent的一件事,到底有没有被完整地、可验证地办成。
在不远的将来,整个互联网行业可能要换一把衡量的标尺。这背后,其实是商业模式的代际更替。智联网,这种以Agent为行为主体的新运行方式,正在悄然生长,有望成为移动互联网的升级版。
移动互联网过去十几年,看似形态各异,但所有变现方式主要是几种基础形式。
广告是最重要的商业模式,按曝光、点击、转化收钱。CPM(每千次曝光定价)、CPC(每次点击定价)、CPA(每次行动转化定价),三套刻度同时在用,把人的眼球时间精确到分秒。Alphabet2025年全年广告收入3427.21亿美元,占总营收的85%;Meta广告收入占比97%以上。这是注意力经济最直接的变现通道,也是整个移动互联网的财务底色。
其次是订阅,按时间收钱。从QQ音乐会员、爱奇艺视频会员,到Netflix,月费或年费换取去广告、高品质、独家内容。这是数字内容产品最稳定的收入方式。
再有是佣金,按交易额抽成。电商订单GMV抽成、外卖订单抽成、网约车单笔抽成、应用商店分发抽成,这是平台型生意最稳固的收入来源。
此外还有服务费等,是平台向生态参与方变现的方式。如,电商平台向商家收取店铺装修费、推广费、保证金,SaaS公司向企业收取功能模块费,本质上都是把流量和工具切片打包卖给商家。
这些模式看似差异很大,其实有一个共同的底层假设:用户的注意力是有限的(一天24小时为天花板),行为是可观测的。无论是广告、订阅、佣金还是服务费,本质上都在围绕一个朴素的问题做文章,即用户在哪里花时间、花了多少钱。
但这套体系在AI时代,有可能出现新的变化。当Agent替用户去办事,注意力不再停留在页面上,这就会让广告失去了曝光基础。当一个Agent同时调用十多家服务方的资源,完成一项复杂任务时,过去包年付费订阅的方式可能不再适用,按次按量计价的需求会越来越多,小额高频交易成为刚需。
也许有人会问一个朴素的问题:移动互联网时代不也有按结果付费吗?应用商店的CPA、网约车的按单抽成,电商的CPC、听起来都跟按结果计费有关。智联网时代真的有那么不同吗?
目前看,区别主要有三条,不在卖什么,而在谁来做、谁记得、谁来付。
首先,执行者从人变成了机器。移动互联网时代,App是工具,用户自己是执行者,按按钮、填表格、看广告、做决定都是用户亲力亲为。智联网时代,Agent才是执行者,用户只下一个意图,剩下的所有动作(搜索、比价、调用、决策、付款)都由Agent完成。这个区别决定了:所有围绕人的注意力建立的计价方式,从根上失去了对象。Agent不需要被吸引、不会被广告打动、也不会因为页面好看多停留三秒。
其次,价值储存器从账号变成了上下文。移动互联网时代,账号是核心资产,因为账号里有我们的购买历史、社交关系、内容偏好等,换App甚至意味着在数字空间重建身份。智联网时代,上下文(Context)成为核心资产。我们跟Agent说过的每一句话、办过的每一件事、表达过的每一个偏好,都在沉淀。迁移成本不仅是丢失账号,更是丢失记忆,而后者比前者深得多。
再次,付款决策开始让渡给Agent。移动互联网时代,用户是付款主体。而智联网时代出现了一个新现象,在部分场景下,付款决策开始让渡给Agent。比如Agent替我们比价、替我们下单、替我们订机票、候补火车票等。当Agent替我们做决定时,各类服务的销售对象就从“说服我们”变成了“要让Agent选上”。这就是为什么GEO(GenerativeEngineOptimization,生成式引擎优化)开始逐步替代SEO,优化对象从人的眼球变成了Agent的偏好。
可以看到,未来的智联网时代,不是某一种商业模式在升级,而是整条价值链路在换基。下面这张表,浓缩了移动互联网和智联网之间最核心的结构性差异:
这些区别汇聚到一起,也指向一个更大的问题,入口之争并没有消失,只是换了战场。移动互联网时代,入口是App图标,谁占据了手机屏幕的第一屏,谁就拿走了用户注意力的第一入口。智联网时代,入口变成了谁第一个接住用户的意图。当用户说出一句话,第一个理解这句话、并且有能力调度资源去执行它的Agent,就是新时代的入口。这解释了为什么AppleIntelligence嵌入Siri、Google把Gemini植入安卓,它们争的不是一个新App,而是新一代入口的卡位权。谁是用户开口说第一句话的对象,谁就掌握了意图分发的起点。从这个角度看,智联网时代的入口之争可能会比移动互联网更激烈,因为它争的不是有限的屏幕空间,而是无限的用户意图。
互联网商业模式的历史告诉我们一个朴素道理,即最后能跑通的模式,往往不是最先进的,而是最简单的。CPM、CPC、CPA等之所以战胜了早期各种复杂的广告效果衡量法,根本原因是它把广告交易简化到三方都不会争。广告主认这个数字、平台认这个数字、第三方监测也认这个数字。
我们看到,行业内,已经有多种新模式在探索,也都还在试错。看哪种能率先把简单清晰、可持续给跑通,哪种就最可能成为智联网的新CPM。
大模型刚出现时,很多应用都采取了订阅服务的模式,每月20美元订阅费几乎成为行业标配。但是不同用户的用量差别很大,由此还衍生出不少二道贩子模式,即把一个订阅账户再卖给好几个人用。特别是今年龙虾火爆后,纯订阅付费的用户Token消耗量急剧上涨,导致Anthropic4月5日起切断了ClaudePro(20美元/月)和ClaudeMax(200美元/月)订阅用户通过OpenClaw等第三方框架的访问权限,要求改回API接入,按量付费。
所以,当前Agent应用,几乎都是订阅加消耗的付费模式,如Manus、Genspark、Cursor、Lovable等。它保留了订阅的预算可控感,又引入了消耗的弹性,这样重度用户多付费,轻度用户也能安心用。
当前已经非常成熟,且未来有可能长期存在的,就是token按量调用的定价模式,这也是Token经济的最基本商业模式。这套模式根据每百万Token的输入和输入分别定价,如果命中缓存,价格会大幅下降。全球最贵的是Anthropic的Claude模型报价,以最新的ClaudeOpus4.8为例,输入5美元,输出25美元/百万token。同时,Token的消耗,跟分词器也有很大关系,不同家的模式,以及不同代的模型,可能会采用不同的分词器,而导致模型消耗价格大幅提升。如,ClaudeOpus4.7及后续版本采用了与之前模型不同的新分词器,这有助于提升其在各类任务中的表现。但对于相同的固定文本,新分词器可能多消耗高达35%的token。而相比Claude,国内的模型报价则便宜很多。由此,行业内也兴起了多模型路由的模式,即80%的一般性任务,用国产开源大模型来做,追求更高的性价比,最难的20%的任务,交由ClaudeOpus4.8、GPT5.5来做,追求更高质量的完成度。
同时,一些新的模式探索也在进行中。最典型的是节约分成,代表玩家如,Salient(AI催收按催回款分成)、Sierra(按解决工单数计费)。这是Sierra创始人BrettTaylor最引以为傲的商业模式创新,因为传统的客服软件是按坐席卖钱的。但这有一个悖论,即AI越强,企业需要的客服人类就越少,那买的坐席就越少,软件公司反而少赚钱。Sierra彻底打破了这一矛盾,它采用结果导向型计费。企业不需要为AI占了多少个坑位给钱,而是为每一次成功的服务买单。如果AI只是做了一个简单的路由(把客户转接给人类),它不收或者只收极低的流量费;只有当AI独立、完整地帮客户解决了问题(比如成功办理了退款、修改了订单、挽留了退订),它才会收取一笔解决费,通常在每单1到1.5美元左右,远低于人类客服10-15美元的成本。
这种模式的逻辑很清晰,客户多挣(少花)的,乙方分一杯羹,双方利益完全对齐。这套模式中国并不陌生。电力领域的EMC(合同能源管理)已经跑了三十年。节能服务公司前期出资改造客户的设备,从客户因此节约的电费里分成(通常50%到70%),合同期满设备归客户。EMC三十年总结出了三条经验:基线必须事先封存(避免事后扯皮),节约必须可第三方验证(电表数据是公允裁判),合同期加阶梯分成衰减(避免基线漂移)。这三条对AI节约分成几乎是现成的合同范式。其难点是基线漂移,因为做一年之后,客户会觉得反正现在效率高已经是常态了,凭什么继续给你分成?
还有一种可能的方式是专家数字分身调用付费。当前非常流行的Skill,可以看作是这种模式的雏形。当然,目前大量的Skill还是广大开发者和用户免费分享,上传到ClawHub、SkillHub等社区。而未来,一些高质量的Skill完全有机会商业化转化。还有一种未来很具前景的是专家数字分身付费订阅,或者按次付费模式。畅想一下:当前Workbuddy上的专家平台上,已经汇聚了不少专家团和个人专家,用户可以一键召唤专家答疑和做方案。一些头部专家已经被调用数百万次,如果未来这些调用商业化,将是一个巨大的长尾市场。就像互联网让标准化的商品和服务实现了供需对接,专家经验也将借由智联网第一次有机会成为标准化的产品,获得市场认可和变现。
这有可能是智联网的雏形,他不是更聪明的App,也不是更好用的搜索,而是一个让人类专业经验第一次可以脱离时间和物理限制,最大化复用的市场。
还有一种未来的可能模式,则是适应多Agent协作,以及多渠道资源获取的新模式。这种模式当前还没有明确的标的,但需求已经在显现。假设我们要做一份具身智能公司的市场研究报告,需要调用证券交易类的MCP,工商注册登记的API、投融资类服务的API、行业研究报告和咨询公司的MCP,前沿技术论文库的MCP、以及一些专业数据库的API等等,这些广泛的数据来源,如果是按照现有的订阅式,订阅如此多的信息源,显然对用户是一个很高的成本,如果能按次调用,按量计费,则可以满足更广大非专业用户的日常使用需求。原来之所以没法实现,是因为人从这些海量信息源查找、整合信息的难度太大,而有了Agent,可以非常方便地查询和处理,因而也需要配合相应的定价和协作模式创新。
按结果付费要落地,必须要明确任务和验收标准,避免容易发生的扯皮,需跨过四道门槛:说不清、算不清、守不住和认不准。过去一些传统的实践,为我们解决智联网时代的争议,已经奠定了一些解决思路,可供我们参考。
除了上面的四道门槛,针对Agent交易小额高频的特征,还需要一种全新的金融服务,即Agent支付,小额高频的新结算基础设施。Stripe已经在2026年初推出了AgentPaymentAPI,允许Agent在预授权额度内完成支付。
今天人类的支付体系,大多是低频大额或中频中额,如月付20美元订阅、单笔50元外卖、年缴数百元会员等。但Agent支付的特征恰好相反:小额高频,一次调用几分钱、几毛钱应该都是常态。一个任务串下来,如果调用几十个服务方资源,每一次调用都要走人类支付的确认流程,整件事根本跑不起来。这意味着Agent支付必须具备一些新特征。
第一,极低单价可结算。服务的定价可以低到一分钱甚至更低。因为Agent调用是高频的,薄利可以靠量来堆。这让过去因为交易成本太高而无法定价的微服务,第一次有了商业化的可能。
第二,免确认自动扣款。Agent在预算授权范围内自主完成支付决策,不需要每笔都弹窗让用户点确认。这要求一套新的授权机制,即用户设上限,Agent在上限内自由调度。
第三,跨服务即时清算。一个任务可能串联十几个服务商,Agent完成任务后系统自动拆账、即时清算,不需要人工对账。
更深一层看,Agent支付会催生全新的定价逻辑。当单次调用成本趋近于零,服务商就不再需要把定价抬高来覆盖交易摩擦。一个翻译服务甚至可以按句收费,一个法律条款检索可以按条收费,一个数据清洗工具可以按行收费。过去因为定价粒度太粗而被迫打包的服务,现在可以被拆成原子级别单独售卖,这或许正是智联网经济得以运转的微循环系统。
a16z判断未来软件公司大致会分成三类。一是正在归零的,即按席位收费的工具型SaaS,会受到新模式的严重挑战。二是正在被削弱的,是大型企业软件,原来企业软件一旦进入核心业务流程,替换成本、迁移风险和组织阻力都很高。客户即使不满意,也很难更换系统。但Agent模式正在逐步改变这种绑定。三是正在涌现的,即直接卖结果的Agent原生模式。前两类是存量博弈,第三类切的是数十万亿美元的劳动力预算,这是未来智联网巨大的增量空间。
类似的判断不只来自a16z。BessemerVenturePartners在2026年的云指数报告中指出,头部AI原生公司的收入增速已经是传统SaaS公司的三倍,但真正拉开差距的不是增速本身,而是净收入留存率。按结果付费的AI公司,客户扩展消费的意愿远高于按账号付费的传统SaaS。McKinsey的一项研究也佐证了这个趋势:企业在AI工具上的支出,正在从IT预算转向业务预算,换句话说,软件不再吃IT预算,而是吃劳动力预算,这才是数十万亿美元增量空间的真正来源。
但所有这些新商业模式都建立在一个底层条件之上,即Token效能(TokenEfficiency)的大幅提升。它衡量的是每一块钱买到多少有用的智能,既包括效率(同样任务消耗多少Token),也包括质量(这些Token转化成多少正确结果)。Token效能将成为效果经济时代的全要素生产率。
最后,还有一个根本的问题需要关注,就是智联网真正的原生应用会长什么样?AINative的出现规律,大概率也会遵循历次技术变革之路:先改造,后涌现。
PC互联网刚出现时,第一批产品是把报纸搬上网(雅虎新闻)、把百科全书搬上网(维基百科)。但真正定义那个时代的原生物种,是搜索、社交和电商。当大量内容涌上网络,就必然产生发现和筛选的需求。再往后,当大量用户涌上网络,就必然产生连接彼此的需求,于是社交网络出现了。当大量商品涌上网络,就必然产生交易撮合的需求,于是电商出现了。
移动互联网也循此路径。第一批产品是把PC搜索做成移动搜索,把PC购物做成移动电商。但真正颠覆的原生物种,来自一个结构性变化:人不再主动找信息,而是信息主动找人。推荐算法和信息流成了移动时代最流行的产品形态。直播电商也类似,手机让商品展示有了讲故事、去现场、实时互动的新可能,于是直播电商跑出来了。
现在AI来了,我们正处在第一阶段,把AI嵌入现有产品。搜索加了AI摘要,客服系统加了机器人,Office加了智能助手。这一波改造当然有价值,但它不是终局。终局是什么?如果规律仍然成立,我们应该问:当大量Agent涌入网络之后,会呈现怎样的模式?
加上前面提到的Agent支付,未来可能是三大方向,即用户主Agent、Agent任务市场和Agent支付基础设施。它们不是独立存在的,而是互相咬合的。主Agent让用户可以省心,任务市场让供需可以匹配,支付让交易可以发生。三者合在一起,才是一个完整的Agent经济系统的雏形。
用户主Agent是个人意图的统一入口。这个主Agent承接用户的各类需求,不管是订机票、写报告、管理日程、投资理财还是预约体检。它了解你的全部上下文,知道你的偏好、预算、时间约束、风险偏好。甚至他可以经受授权,一定程度上代表你,去和各个垂直领域的服务型Agent对接和决策。这个架构一旦成立,商业模式的重心就会发生根本性迁移:从toC变成toAgent。服务的客户不再是人,而是人的Agent。各类服务可能需要去考虑,如何抢占Agent的心智,即在主Agent的评估体系里得分最高。
Agent的任务市场会催生竞价与评测平台。当用户有一个任务要完成,而市场上有成百上千个服务型Agent都声称能做这件事,就必然需要一个撮合机制。想象一个场景:你让你的主Agent帮你做一份竞品分析报告。主Agent把这个任务发布到一个开放市场上。三十秒内,十几个专业调研Agent报价,有的按完成度收费,有的按页数收费,有的按数据源数量收费。市场平台根据历史评分、完成率、用户评价等做排序,你的主Agent综合价格和质量做出选择。这就是Agent时代的竞价平台。它和今天搜索引擎广告的竞价排名有本质区别。竞价排名卖的是展示位置,Agent竞价平台卖的是任务完成承诺。但这个平台要跑通,至少需要解决三个问题:一是如何评测任务完成质量?是客户主观评分、第三方审计、还是预设的量化标准?二是如何防止恶意低价中标?有的Agent可能报极低价拿到任务,再用低质量交付来骗取首付款。三是如何建立Agent的信用体系,类似今天的信用分,但对象是Agent而非人。
所以,智联网的效果变现能否真正成立,还取决于一件更基础的事,在一个Agent满天飞、人类逐渐隐入对话框背后的世界里,我们怎么知道一个Agent是谁、它做过什么、它说的是不是真的?换句话说,当机器开始替人办事,互联网的信任机制必须重写,这将是下一篇要讨论的问题:信任篇·可证明的Agent。
王强腾讯研究院前沿科技研究中心主任

