OpenRouter 報告揭示 AI 邁入代理推理時代、中國開源模型憑藉角色扮演與編程能力,在全球市場強勢崛起 […] 〈OpenRouter 分析 100 兆 Token 研報:人類到底用 AI 做什麼、中國模型崛起與用戶留存秘密〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。OpenRouter 報告揭示 AI 邁入代理推理時代、中國開源模型憑藉角色扮演與編程能力,在全球市場強勢崛起 […] 〈OpenRouter 分析 100 兆 Token 研報:人類到底用 AI 做什麼、中國模型崛起與用戶留存秘密〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

OpenRouter 分析 100 兆 Token 研報:人類到底用 AI 做什麼、中國模型崛起與用戶留存秘密

2025/12/06 13:50

OpenRouter 報告揭示 AI 邁入代理推理時代、中國開源模型憑藉角色扮演與編程能力,在全球市場強勢崛起、以及分享用戶的真實使用場景。 (前情提要:木頭姐表態「AI不是泡沫」: 正在複製網路的財富爆炸時刻) (背景補充:Google 正式推出「Gemini 3」!登頂全球最聰明 AI 模型,有什麼亮點?)   AI 模型聚合平台 OpenRouter 本週發布了年度重磅報告《2025 年 AI 現狀報告》。這份報告並非基於問卷調查或新聞炒作,而是對 OpenRouter 平台上產生的 100 兆(100 Trillion)Token 數據進行了實證分析。 這些數據橫跨 300 多個大型語言模型(LLM)與 60 多家供應商,為我們提供了一個新視角,得以窺見 AI 在真實世界中「究竟是如何被使用的」? 範式轉移:從「預測下一個字」到「代理推理」 如果說 2024 年以前的 AI 競賽是關於誰能更流暢地接龍寫作,那麼 2025 年的主題就是「思考」。報告指出,過去一年標誌著 LLM 演進的真正分水嶺。 o1 模型與推理時代的開啟 報告將 2024 年 12 月 5 日 定義為產業的關鍵轉捩點,這一天 OpenAI 發布了首個廣泛採用的推理模型:o1。在此之前,即便是最強大的模型(如 Claude 3.5 Sonnet 或 GPT-4),其本質仍是單次前向傳播的概率預測器。它們依賴訓練數據中的模式來模仿推理,而非進行真正的內部計算。 o1 的出現改變了這一切。它引入了推論時的計算過程,模型在給出最終答案前,會先進行內部的多步深思熟慮(Deliberation)、潛在規劃(Latent Planning)和自我修正。 數據佐證: 根據 OpenRouter 的統計,自 2025 年初以來,流向「推理優化模型」的 Token 比例呈指數級增長。到了 2025 年底,超過 50% 的 Token 使用量都涉及這類具備思考能力的模型。這意味著,用戶不再只把 AI 當作聊天機器人,而是將其視為能夠解決複雜邏輯問題的「大腦」。 代理工作流的興起 伴隨著推理能力的提升,「代理工作流」成為另一個關鍵詞。用戶開始構建複雜的自動化系統,讓模型不僅僅是回答問題,而是「採取行動」。 報告特別分析了「工具調用」的數據。這是一種讓 AI 模型能夠使用外部工具(如搜尋網路、執行程式、查詢數據庫)的能力。 趨勢: 工具調用的使用量在 2025 年全年呈現穩定且顯著的上升趨勢。 模型格局: 起初,這一領域由 OpenAI 的 gpt-4o-mini 和 Anthropic 的 Claude 3.5 系列主導。但到了下半年,市場百花齊放,Google 的 Gemini Flash、xAI 的 Grok Code Fast 以及中國的 GLM 4.5 等模型在工具使用能力上迅速追趕,推動了企業級自動化的普及。 開源與閉源的戰爭:中國模型的崛起 在模型生態方面,報告揭示了一個雖由閉源模型主導營收,但開源模型(OSS)在創新與特定領域佔據關鍵地位的雙軌世界。 閉源模型仍佔大宗,但開源勢力抬頭 儘管閉源模型(如 GPT-5、Claude 4.5)在 Token 總消耗量上仍佔據約 70% 的份額,但在過去一年中,開源模型的市場份額增長曲線極為陡峭,已接近 30%。 這表明,開發者和企業越來越傾向於在可控性、隱私和成本之間尋求平衡,而高質量的開源模型提供了這個選項。 中國開源模型的統治力 報告中有一個引人注目的發現:中國開發的開源模型已經成為全球開源生態的中流砥柱。 核心玩家: 阿里巴巴的 Qwen(通義千問) 系列、DeepSeek(深度求索) 以及 Moonshot AI 的 Kimi 等模型,在 OpenRouter 的全球調用量中佔據了極大比例。 競爭優勢: 報告指出,中國模型之所以能迅速崛起,主要得益於其「密集的迭代週期」和「極具競爭力的模型質量」。例如,Qwen 2.5 Coder 在程式設計領域的表現,直接挑戰了許多閉源模型的地位。 獨特定位: 數據顯示,中國開源模型在「內容過濾」上相對較少(相較於某些西方模型嚴格的安全護欄),這使得它們在 創意寫作、角色扮演(Roleplay) 以及故事續寫等場景中更受全球用戶歡迎。 模型尺寸的「M型化」發展 開源市場內部也發生了有趣的結構性變化: 小型模型的衰退: 儘管 Google 推出了 Gemma 等小型模型,但整體使用量正在下降。用戶發現小型模型的智力上限限制了其在複雜任務中的應用。 中型模型的黃金時代: 32B(320 億參數)左右的模型成為了「甜蜜點」。以 Qwen 2.5 Coder 32B 為代表,這類模型在性能與推理成本之間找到了完美的平衡,成功建立了「模型-市場契合度」(Model-Market Fit)。 大型模型的多元化: 在 70B 到 200B+ 參數的區間,市場並未被單一模型壟斷,而是呈現多元競爭態勢(如 Llama 3 系列、Qwen 72B 等),用戶會根據具體任務在不同大模型間切換。 真實場景:人類到底用 AI 做什麼? 這或許是報告中最具啟發性的部分。通過 OpenRouter 的 GoogleTagClassifier 分類系統,研究團隊對數十億次請求進行了內容分類。結果打破了許多關於「AI 主要用於商務生產力」的刻板印象。 角色扮演 數據顯示,角色扮演遊戲是開源模型(OSS)使用量最大的類別,佔比高達 60% 以上。 現象: 大量的用戶使用 AI 進行虛擬角色對話、互動小說創作和沈浸式遊戲體驗。這不僅僅是小眾愛好,而是一個龐大的剛需市場。 驅動因素: 用戶偏好使用開源模型進行角色扮演,主要是因為這些模型(尤其是來自非美國實驗室的模型)通常具有較少的審查限制,能夠提供更豐富、更不受拘束的互動體驗。 商業價值: 這些用戶展現出了驚人的黏性,他們圍繞著特定的模型建立了深厚的情感連結和使用習慣。 程式設計 緊隨其後的是程式設計類別。這也是增長最快的類別之一。...

免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 service@support.mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡

里山奧運復刻50年前野球魂 田間甲子園熱血開打

里山奧運復刻50年前野球魂 田間甲子園熱血開打

地方中心/綜合報導 草總謝長亨親臨開球、鯉魚旗首度升起 攜手社區及企業打造最有土地味的永續盛會 「里山奧運-一 […] 這篇文章 里山奧運復刻50年前野球魂 田間甲子園熱血開打 最早出現於 民生頭條。
分享
Lifetoutiao2025/12/06 21:52
顛覆高端鐘錶市場的「畢卡索」Gérald Charles Genta 瑞士獨立高級製錶品牌 Gerald Charles 正式登陸台灣

顛覆高端鐘錶市場的「畢卡索」Gérald Charles Genta 瑞士獨立高級製錶品牌 Gerald Charles 正式登陸台灣

引領鐘錶市場30年風潮的Gérald Charles Genta大師,透過一次次創新顛覆的品牌合作,催生出一支支扣人心弦的傳奇錶款,近幾年鐘錶市場瘋搶的各家經典錶款,都能見到大師韻意超凡的匠心靈魂。Gérald Charles Genta大師,不僅僅對於瑞士鐘錶的設計概念,挹注了超越時代的新意與養份,同時也是製錶師自創獨立品牌的先鋒 (資料來源:威傳媒新聞-WinNews) 延伸閱讀: QS 2025世界大學排名出爐:台灣大學持續向前邁進 臺北最強牛肉麵霸主誕生 皇家傳承、阿牛牛肉麵、牛將軍小吃店分組奪冠 朝陽科大視傳系第27屆畢業校內成果展Popopo! 製造紀錄實作軌跡
分享
WinNews2025/12/06 22:05