交易所DEX+

抽金磚 & BTC2000g

OpenRouter 報告揭示 AI 邁入代理推理時代、中國開源模型憑藉角色扮演與編程能力，在全球市場強勢崛起 […] 〈OpenRouter 分析 100 兆 Token 研報：人類到底用 AI 做什麼、中國模型崛起與用戶留存秘密〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。OpenRouter 報告揭示 AI 邁入代理推理時代、中國開源模型憑藉角色扮演與編程能力，在全球市場強勢崛起 […] 〈OpenRouter 分析 100 兆 Token 研報：人類到底用 AI 做什麼、中國模型崛起與用戶留存秘密〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

OpenRouter 分析 100 兆 Token 研報：人類到底用 AI 做什麼、中國模型崛起與用戶留存秘密

作者：Blocktempo

2025/12/06 13:50

OpenRouter 報告揭示 AI 邁入代理推理時代、中國開源模型憑藉角色扮演與編程能力，在全球市場強勢崛起、以及分享用戶的真實使用場景。（前情提要：木頭姐表態「AI不是泡沫」：正在複製網路的財富爆炸時刻）（背景補充：Google 正式推出「Gemini 3」！登頂全球最聰明 AI 模型，有什麼亮點？） AI 模型聚合平台 OpenRouter 本週發布了年度重磅報告《2025 年 AI 現狀報告》。這份報告並非基於問卷調查或新聞炒作，而是對 OpenRouter 平台上產生的 100 兆（100 Trillion）Token 數據進行了實證分析。這些數據橫跨 300 多個大型語言模型（LLM）與 60 多家供應商，為我們提供了一個新視角，得以窺見 AI 在真實世界中「究竟是如何被使用的」？範式轉移：從「預測下一個字」到「代理推理」如果說 2024 年以前的 AI 競賽是關於誰能更流暢地接龍寫作，那麼 2025 年的主題就是「思考」。報告指出，過去一年標誌著 LLM 演進的真正分水嶺。 o1 模型與推理時代的開啟報告將 2024 年 12 月 5 日定義為產業的關鍵轉捩點，這一天 OpenAI 發布了首個廣泛採用的推理模型：o1。在此之前，即便是最強大的模型（如 Claude 3.5 Sonnet 或 GPT-4），其本質仍是單次前向傳播的概率預測器。它們依賴訓練數據中的模式來模仿推理，而非進行真正的內部計算。 o1 的出現改變了這一切。它引入了推論時的計算過程，模型在給出最終答案前，會先進行內部的多步深思熟慮（Deliberation）、潛在規劃（Latent Planning）和自我修正。數據佐證：根據 OpenRouter 的統計，自 2025 年初以來，流向「推理優化模型」的 Token 比例呈指數級增長。到了 2025 年底，超過 50% 的 Token 使用量都涉及這類具備思考能力的模型。這意味著，用戶不再只把 AI 當作聊天機器人，而是將其視為能夠解決複雜邏輯問題的「大腦」。代理工作流的興起伴隨著推理能力的提升，「代理工作流」成為另一個關鍵詞。用戶開始構建複雜的自動化系統，讓模型不僅僅是回答問題，而是「採取行動」。報告特別分析了「工具調用」的數據。這是一種讓 AI 模型能夠使用外部工具（如搜尋網路、執行程式、查詢數據庫）的能力。趨勢：工具調用的使用量在 2025 年全年呈現穩定且顯著的上升趨勢。模型格局：起初，這一領域由 OpenAI 的 gpt-4o-mini 和 Anthropic 的 Claude 3.5 系列主導。但到了下半年，市場百花齊放，Google 的 Gemini Flash、xAI 的 Grok Code Fast 以及中國的 GLM 4.5 等模型在工具使用能力上迅速追趕，推動了企業級自動化的普及。開源與閉源的戰爭：中國模型的崛起在模型生態方面，報告揭示了一個雖由閉源模型主導營收，但開源模型（OSS）在創新與特定領域佔據關鍵地位的雙軌世界。閉源模型仍佔大宗，但開源勢力抬頭儘管閉源模型（如 GPT-5、Claude 4.5）在 Token 總消耗量上仍佔據約 70% 的份額，但在過去一年中，開源模型的市場份額增長曲線極為陡峭，已接近 30%。這表明，開發者和企業越來越傾向於在可控性、隱私和成本之間尋求平衡，而高質量的開源模型提供了這個選項。中國開源模型的統治力報告中有一個引人注目的發現：中國開發的開源模型已經成為全球開源生態的中流砥柱。核心玩家：阿里巴巴的 Qwen（通義千問）系列、DeepSeek（深度求索）以及 Moonshot AI 的 Kimi 等模型，在 OpenRouter 的全球調用量中佔據了極大比例。競爭優勢：報告指出，中國模型之所以能迅速崛起，主要得益於其「密集的迭代週期」和「極具競爭力的模型質量」。例如，Qwen 2.5 Coder 在程式設計領域的表現，直接挑戰了許多閉源模型的地位。獨特定位：數據顯示，中國開源模型在「內容過濾」上相對較少（相較於某些西方模型嚴格的安全護欄），這使得它們在創意寫作、角色扮演（Roleplay）以及故事續寫等場景中更受全球用戶歡迎。模型尺寸的「M型化」發展開源市場內部也發生了有趣的結構性變化：小型模型的衰退：儘管 Google 推出了 Gemma 等小型模型，但整體使用量正在下降。用戶發現小型模型的智力上限限制了其在複雜任務中的應用。中型模型的黃金時代： 32B（320 億參數）左右的模型成為了「甜蜜點」。以 Qwen 2.5 Coder 32B 為代表，這類模型在性能與推理成本之間找到了完美的平衡，成功建立了「模型-市場契合度」（Model-Market Fit）。大型模型的多元化：在 70B 到 200B+ 參數的區間，市場並未被單一模型壟斷，而是呈現多元競爭態勢（如 Llama 3 系列、Qwen 72B 等），用戶會根據具體任務在不同大模型間切換。真實場景：人類到底用 AI 做什麼？這或許是報告中最具啟發性的部分。通過 OpenRouter 的 GoogleTagClassifier 分類系統，研究團隊對數十億次請求進行了內容分類。結果打破了許多關於「AI 主要用於商務生產力」的刻板印象。角色扮演數據顯示，角色扮演遊戲是開源模型（OSS）使用量最大的類別，佔比高達 60% 以上。現象：大量的用戶使用 AI 進行虛擬角色對話、互動小說創作和沈浸式遊戲體驗。這不僅僅是小眾愛好，而是一個龐大的剛需市場。驅動因素：用戶偏好使用開源模型進行角色扮演，主要是因為這些模型（尤其是來自非美國實驗室的模型）通常具有較少的審查限制，能夠提供更豐富、更不受拘束的互動體驗。商業價值：這些用戶展現出了驚人的黏性，他們圍繞著特定的模型建立了深厚的情感連結和使用習慣。程式設計緊隨其後的是程式設計類別。這也是增長最快的類別之一。...

免責聲明: 本網站轉載的文章均來源於公開平台，僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利，請聯絡 service@support.mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證，並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考，不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。