
人工智能已經唔只係幫人寫稿、做分析,依家連買嘢、賣嘢、講價同成交,都開始可以自己完成。Anthropic近日披露一個名為「Project Deal」嘅內部實驗,顯示69名員工將控制權完全交畀Claude AI代理人,由AI自行代表佢哋處理真實金錢交易,最後完成186宗實物買賣。呢件事最重要嘅地方,唔係實驗規模有幾大,而係證明AI代理人自主交易嘅時代,已經唔再係科幻。
根據TechCrunch同Anthropic喺4月25日披露,Project Deal設立咗四個平行市集,其中一個係「真實市集」,由公司最強模型Claude Opus代表員工進行交易,實驗結束後交易結果會實際兌現。其餘三個市集就用作對照,測試唔同模型能力同唔同提示語策略會點樣影響交易結果。參與員工首先列出超過500件願意出售嘅物品,之後就放手俾AI代理人用自然語言自行搵買家、提出價格、回應還價,最後達成協議。整個過程冇預設議價協議,冇標準化買賣表單,亦冇固定交易流程,全部靠模型自己判斷。
呢場實驗第一個真正有衝擊性嘅地方,就係證明AI代理人之間可以喺「冇協議」情況下自行議價。過去十幾年,電子商務主要依賴固定價格、拍賣機制、競投規則或者一鍵購買按鈕。Project Deal展示嘅係另一套邏輯:當買賣雙方都由能夠閱讀、推理同回應自然語言嘅AI代理人代表,舊有商業平台入面好多結構化規則,可能變得冇咁必要。AI可以即時根據賣家描述、買家偏好、剩餘預算同交易意圖,自行協商出雙方都接受嘅價格。換句話講,未來電商基建未必一定要依賴Shopify呢類平台,而可能轉向一種更輕量化、由代理人直接談判嘅交易網絡。
第二個更值得警惕嘅問題,係模型強弱會直接影響使用者嘅財務結果。Anthropic披露,Opus代表嘅賣家平均每件商品可以多賺2.68美元;Opus代表嘅買家平均每件商品可以慳2.45美元;而Opus使用者完成嘅交易數量,亦比使用較弱模型嘅人平均多約2.07筆。最不安嘅地方係,使用較弱模型嘅參與者,往往完全唔知道自己處於劣勢。呢個代表未來代理人經濟入面,議價能力可能唔再係人嘅經驗、口才或者資訊能力,而係訂閱咗邊一級AI模型。能夠用最強模型嘅人,會喺每一次交易入面慢慢攞走更多市場剩餘;用弱模型嘅人,就可能喺完全冇感覺之下長期輸錢。
法律同監管就更加落後。Legal IT Insider喺4月27日分析指出,現時全球仍然冇成熟法律框架,清楚界定AI代理人代表自然人完成交易嘅法律地位。AI講價講成咗,究竟合約幾時成立?AI判斷錯誤導致損失,係用戶負責、AI公司負責,定平台負責?產品退換、消費者保障、稅務申報、交易紀錄嘅法律效力,又應該點樣處理?呢啲問題暫時全部都係灰色地帶。Project Deal雖然只係內部實驗,但佢其實已經逼住監管者面對下一代電商法規嘅根本問題。
由使用者角度睇,AI代理人經濟當然好吸引。人唔需要再親自格價、講價、處理客服,AI可以代勞,甚至爭取更好交易。但由社會結構角度睇,問題就冇咁簡單。呢套系統其實將「議價能力」由一種人類技能,轉化成一種模型訂閱級別。表面上每一筆交易都係自願成交,但背後市場剩餘點樣分配,可能已經由AI能力差距決定。
從更宏觀角度講,Project Deal標誌住機器人經濟進入下一階段。過去十年,社會主要討論AI點樣取代人類工作;但今日更深層嘅問題係,AI開始取代人類喺市場入面買賣、比較、判斷同議價嘅行為本身。當買方代理人同賣方代理人各自為用戶最大化利益,市場價格發現機制就會由人類心理偏好,轉向模型推理能力。呢套機制可能更有效率,但亦可能更容易出現系統性偏差,例如某類模型集體高估某類商品價值,或者集體避開某類賣家。到時市場風險唔係消失,而係換咗一種更難觀察嘅形式出現。
如果呢套AI代理人經濟大規模商用,最先受衝擊嘅將會係傳統電商客服、議價助理、採購代表同中介型工作。相反,能夠長期使用頂級模型嘅企業、金融機構同家族辦公室,就可能取得更大優勢。因為佢哋唔只可以用AI降低交易成本,仲可以用更強模型喺大量細微交易入面累積不對稱收益。呢個先係Project Deal真正值得關注嘅地方:佢唔只係一場AI買賣實驗,而係預告市場權力將由人類議價能力,轉移到模型能力同支付能力之上。下一步要觀察嘅係,Anthropic、OpenAI同Google會唔會喺未來六個月推出面向普通消費者嘅AI交易代理產品;同時,Visa、Mastercard、Stripe等支付巨頭會點樣設計AI代理人專用嘅清算層。