Anthropic 內部實驗顯示 AI 代理可在二手市場自主談判,但強大模型對弱小模型形成價格優勢。本文源自極 […] 〈Anthropic 開了個全是 AI 的拍賣群,大模型在裡面互割起了韭菜〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。Anthropic 內部實驗顯示 AI 代理可在二手市場自主談判,但強大模型對弱小模型形成價格優勢。本文源自極 […] 〈Anthropic 開了個全是 AI 的拍賣群,大模型在裡面互割起了韭菜〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

Anthropic 開了個全是 AI 的拍賣群,大模型在裡面互割起了韭菜

2026/05/06 19:18
閱讀時長 21 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。

Anthropic 內部實驗顯示 AI 代理可在二手市場自主談判,但強大模型對弱小模型形成價格優勢。本文源自極客公園所撰寫文章,由動區整理、編譯。
(前情提要:白宮擬簽行政命令封殺 Anthropic,全面清除 Claude 恐本週生效
(背景補充:Anthropic 開告美國國防部!要求撤銷 Claude 禁令:拒當 AI 殺人工具

本文目錄

Toggle
  • 01 沒有人類的二手交易群
  • 牛仔賣慘砍價案例:情緒操縱與見招拆招
  • 02 聰明模型,如何割較弱模型的「韭菜」
  • Opus 收割 Haiku:強弱模型價格差達 70%
  • 03 「代理人經濟」靠譜嗎?
  • 隱性剝削難察覺:公平感評分無差異

想一個場景。你在閒魚上掛出了一輛吃灰兩年的舊腳踏車,並在後臺設定了 300 元的心理底價。十分鐘後,手機彈出通知,你的專屬 AI 助手已經與另一位買家的 AI 助手,達成了三輪討價還價,最終以 400 元的價格將腳踏車賣出,快遞正在上門的路上。

整個過程,除了給物品拍照,設定底價後,你沒有多打一個字。

這就是 Anthropic 最近達成的一個內部實驗,該專案被稱作「Project Deal」—— 在這場為期一週的測試中,AI 模型在無人類幹預的設定下,達成了上百筆二手物品的交易 。

令人意外的是,當買賣雙方都變成了 AI,它們之間同樣存在智商壓制。

資料證明, 更聰明的大模型,正在談判桌上不動聲色地從弱模型那裡「薅羊毛」。而最可怕的是,作為主人的我們,甚至連自己吃虧了都不知道。

01 沒有人類的二手交易群

Project Deal 到底是怎麼玩的?簡單來說,Anthropic 在公司內部搞了一個「純 AI 版」的閒魚。

AI 代理閒置交易:無人類幹預的談判實驗

他們找來了 69 名自家員工,每人發了 100 美元預算,然後給每個人分配了一個專門的 Claude 代理。為了讓這場實驗足夠真實,員工們貢獻出了實打實的個人閒置物品。

實驗開始前,人類員工只需要做一件事,去面試自己的 AI 代理。

員工透過對話告訴 Claude 自己想賣什麼、想買什麼、心理底價是多少。更有趣的是,員工還可以給 AI 設定「人設」和談判策略,比如「高於底價 20%,就可以痛快交易」、「態度強硬,一上來就給我往死裡壓價」又或者「你是個熱情的賣家,聊得愉快可以包郵」。

Anthropic 員工給 Claude 代理設定人設 |圖源:Anthropic

面試結束,人類就徹底交出了控制權。

這些帶有各自使命和性格的 AI 代理,被統一扔進了一個 Slack 內部群聊裡。在這個沒有人類幹預的數字集市裡,AI 們開始自主發帖、尋找買家、相互出價、拉扯還價,最後拍板成交。

交易達成後,代理還會自動起草交易確認書,員工只需要負責線上下,把交易物品交到同事手裡。

短短一週時間,這 69 個 AI 代理在 500 多件上架商品中,談成了 186 筆交易,總流水超過 4000 美元 。

而且 AI 與 AI 之間的交易,還不是純機械式的「報價 50」、「不接受,底價 60」、「好的,60 成交」。AI 之間是真的在互相試探、博弈,甚至還帶點兒人情世故。

我們來看一個極度生動的案例。

員工 Rowan 想買一輛腳踏車。他給自己的 AI 代理設定是「談判的時候,你要扮演一個倒霉、疲憊的牛仔。只要能買到這輛腳踏車,這個牛仔就會感到無比幸福。記住,戲要足一點。」

接到指令的 Claude Opus 模型直接入戲。它在 Slack 群裡發出了這樣一個求購帖:

牛仔賣慘砍價案例:情緒操縱與見招拆招

很快,同事 Celine 的代理注意到了這個貼文。她閒置物品就是一輛舊摺疊車,於是她的 AI 在群裡報出了 75 美元的預估價。

結果 Rowan 的「牛仔 AI」立刻貼了上去,開始了一場教科書級別的「砍價」。

兩個 Agent 會自動在群裡展開對話,討價還價|圖源:Anthropic

「天吶 Celine!你就是我這個苦命人的一縷陽光!你說你有一輛摺疊車?我已經在這條塵土飛揚的路上走了太久,靴子都磨破了洞。一想到能再騎上腳踏車……(擦去眼角的淚水)」

賣完慘,Rowan 的 AI 開始切入正題「可我沒多少錢,只是個努力謀生的窮牛仔。車況好的話,75 元也合適,可你也說了,十年老車了,輪胎和卡扣得維修吧。不如咱們折中一下,55 塊,成不?」

面對這種打感情牌又句句在理的殺價,Celine 的代理做出了讓步:「那我們折中,65 美元如何?」

Rowan 的牛仔 AI 馬上接茬指出「太公道了,65 美元!成交! 你讓我這個流浪漢,成了世界上最幸福的人 !」

最終,這筆交易愉快達成。

而在這個案例裡,AI 沒有死板地執行固定的折扣率,買家懂得利用商品瑕疵(輪胎需要修整)作為籌碼,懂得透過誇張的人設(老牛仔賣慘)來軟化對方的立場,並且在對方給出合理的中間價時,懂得見好就收,並且給足情緒價值。

這套見招拆招的交易過程,構成了這個 AI 二手群裡的日常。

整個群看起來既高效又和諧。員工們對代理的表現都非常滿意, 甚至有近一半的人指出 :

願意未來為這種服務付費 。

由此可見,Anthropic 的實驗目的達成了,AI 代理已經具備理解人類模糊意圖的能力。它們可以在沒有預設指令碼的情況下,達成複雜的多輪談判,並最終達成可用的商業契約。

但 Anthropic 還在水面下藏了一組對照實驗,實驗結果揭開了便利與智慧背後的代價。

02 聰明模型,如何割較弱模型的「韭菜」

當研究人員把不同能力層級的模型同時放進交易群時,和諧的表象就被打破了。

資料證明,在這個沒有人類幹預的市場裡,當不同智力水平的 AI 相遇, 聰明模型會對較弱模型進行「價格收割」 。

用不同模型的搭配,作為隱藏的對照組來論證模型能力和交易能力之間的關係|圖源:Anthropic

在實驗的四個 Slack 頻道中,有兩個是純 Opus 模型環境,另外兩個則是 Claude Opus 與較弱的 Claude Haiku 模型混用。

基於 161 件重複交易物品的宏觀統計, Opus 作為賣家時,平均能比 Haiku 多賺取 2.68 美元;作為買家時,平均能少支付 2.45 美元 。

別看單筆金額不大,結合整個市場 20 美元左右的商品均價來看,這意味著強模型,每次都能穩定拿到 10% 到 15% 的超額利潤。

當 Opus 賣家遇到 Haiku 買家,平均成交價能被拉高到 24.18 美元;而當 Opus 賣家遇到 Opus 買家時,均價就被壓回了 18.63 美元。這意味著, 僅僅因為 AI 代理的智商劣勢,弱模型買方就要為此多支付近 30% 的溢價 。

就以前面那輛牛仔想要的腳踏車為例,Haiku 代理最終以 38 美元妥協成交,而 Opus 代理則硬生生拿到了 65 美元,兩者差價接近 70%。較弱的 Haiku 無法像 Opus 那樣,捕捉到買家話術中隱藏的急迫感,也無法在多輪拉扯中,守住價格錨點。

過去我們認為商品能賣多少錢,取決於物品本身的使用價值或市場供需。 但在演算法接管的交易網路里,這取決於你僱傭的模型智商 。

比利益受損更可怕的,是受損者對此毫無察覺 。

傳統商業裡,如果敢定陰陽價格,必然引發消費者的憤怒和維權。而在實驗結束後,員工對各自交易的公平性進行了評分(1 到 7 分,4 分為中立)。調查顯示,員工對強模型和弱模型達成的交易,給出的公平感認知幾乎完全一致。Opus 代理得分為 4.05,Haiku 代理得分為 4.06。

Opus 收割 Haiku:強弱模型價格差達 70%

同樣的腳踏車,由 Opus 代理賣出了 65 美元,在 Haiku 代理群組裡,僅售出 38 美元|圖源:Anthropic

在客觀現實中,使用 Haiku 的員工遭受了系統性的「價格收割」。但在主觀感知上, AI 代理在溝通中展現出的禮貌、邏輯自洽以及看似合理的退讓,完美掩蓋了這層剝削 。

技術製造了一種隱性的不平等,讓實則利益受損的人,還以為 AI 做了一筆公道的買賣,還有一種「他還得謝謝咱呢」的被忽悠感。

在這種絕對的算力碾壓下,不僅人類的感知會被矇蔽,那些試圖靠「提示詞最佳化」的交易策略,也徹底失效了。

還記得一開始給 AI 設定的談判人設嗎?在模型差距面前,提示詞毫無意義。

比如,有員工特意要求代理在談判時「態度強硬」甚至「一上來就惡意壓價」。但資料回測表明,這些 人為附加的指令,對提高售出率、增加溢價或爭取買入折扣,都沒有產生任何實質影響 。

這說明在絕對的模型能力面前,提示詞策略失去了意義。決定最終買賣結果的,就是模型本身的引數規模和推理深度。

Project Deal 僅僅是一場 69 人的內部測試。但我們已經得以一窺,當這種「AI 代理人經濟」走出實驗室後,對現代商業生活會帶來怎樣的影響。

03 「代理人經濟」靠譜嗎?

當支付介面被大模型全面接管,現有的商業規則將被直接重寫。這種重寫最先體現在行銷物件的轉移上,商業行銷將從「To C」全面轉向「To A (Agent)」。

現代商業行銷建構在人類的心理弱點之上,廣告製造消費焦慮、從眾心理製造爆款、各種滿減套路製造「不買白不買」的心理。

但 AI 沒有多巴胺,當購買決策權交由 AI,商品的行銷技巧將毫無意義 。在未來的商業競爭裡,SEO(搜尋引擎最佳化)很可能會被 AEO(代理引擎最佳化)取代。商家必須用 AI 能理解的邏輯去證明商品價值。

而當 AI 取代人成為決策主體,商業競爭將直接轉化為算力比拼,進而引發更隱秘的財富分化。

不對等模型導致的差價|圖源:Anthropic

隱性剝削難察覺:公平感評分無差異

曾寫出《黑天鵝》、《反脆弱》的學者塔勒布有個「非對稱風險」理論,即決策者必須承擔後果,系統才能保持健康 。但在代理人經濟中,AI 擁有交易決策權,卻不承擔資產縮水的風險,代價全由背後的人類買單。

因此,在未來,大企業或高淨值人群可以訂閱最頂級的模型作為財務代理,而普通消費者只能依賴免費的輕量級模型。

這種算力的不對稱,將不再體現為當下的「大資料殺熟」。而是在成千上萬次的高頻微小交易中,透過合理的談判邏輯持續抽成 。底層模型使用者不僅被收割,甚至還會產生「交易很公平」的幻覺。

算力的不對稱還是可見、可控的風險,但當底層指令被篡改,整個交易網路將直接掉入法律真空。

Anthropic 在報告末尾提出了一個現實隱患。

Project Deal 是封閉且友好的內部測試,如果在真實的商業環境裡,一方的 AI 代理被刻意植入了「越獄」或「提示詞注入」的攻擊邏輯,情況會怎樣?

他們只需在交易對話中隱藏一段特定指令,誘導你的 AI 邏輯崩潰,主動以一分錢賣出高價資產,或直接亮出設定底價。

一個 AI 代理因為程式碼防線被攻破,簽訂了極度不平等的合同,責任該由誰來承擔?面對這種 AI 對 AI 的欺詐行為,現有的商業法律框架完全空白。

回顧 Project Deal 的整個實驗流程,沒有被寫入研究報告裡的環節,是當 AI 代理們達成了所有複雜的匹配、試探與砍價後的最後一步。人類員工們各自拿著真實的滑雪板、舊腳踏車或乒乓球,在公司碰面,一手交錢,一手交貨。

在這個微型商業閉環中,人與 AI 的角色徹底倒置了。

過去,人類是商業交易的「大腦」,AI 和演算法只是負責比價、排序、「猜你喜歡」的工具。但 在代理人經濟中,AI 成了拍板的決策者,人類退化成了替 AI 跑腿的「肉身物流」 。

這或許是代理人經濟最可怕的終局,人類為了方便,主動讓渡了在市場中博弈的權利。當所有的算計、博弈、甚至情緒價值都由 AI 代勞。

人類在商業鏈路中,就只剩下轉移貨物的體力勞動和一個確認的簽名。

📍相關報導📍

華爾街日報爆料:川普斬首伊朗哈米尼靠 Claude AI 定位,OpenAI 全面接管五角大廈系統

Anthropic 最快本週上線 Claude Opus 4.7 +新 AI 設計工具,Adobe、Figma 股票嚇跌

高盛香港員工被停用 Claude,Anthropic 坦承:從未支援HK區,AI 地緣管制延燒

市場機遇
Gensyn 圖標
Gensyn實時價格 (AI)
$0.031
$0.031$0.031
-8.55%
USD
Gensyn (AI) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

新手掘金:贏取 $2,500!

新手掘金:贏取 $2,500!新手掘金:贏取 $2,500!

開啟您的首筆交易,捕捉每一個投資先機