人工智能發展進入新階段。總部位於美國三藩市的人工智能公司 OpenAI 預告,將於今個夏季發布五年來首個免費開源的大型語言模型(LLM),並同時規劃加入一項名為「雲端接力」(Cloud Handoff)的創新功能。這項動向被外界視為 OpenAI 應對 Meta、DeepSeek 等競爭對手開源策略的回應,有望改變開發者與企業使用 AI 的方式。
根據 OpenAI 發言人確認,這個即將推出的模型將採取開放權重(open weight)方式釋出,容許用戶在本地部署、自行調整或進行再訓練,無須透過 API 使用或支付授權費用。這亦是該公司自 2019 年 GPT-2 模型開源後,首次再次公開完整模型權重。模型由研究副總裁 Aidan Clark 領導開發,是全新訓練而非既有模型簡化版本,其性能預期略低於 OpenAI 最新商業模型 o3,但在某些推理能力方面,或可媲美甚至超越中國 AI 新創 DeepSeek 近期發表的 R1 模型。
較為引人關注的,還包括 OpenAI 同步提出的一項混合處理架構構想,稱為「雲端接力」。根據公司內部初步規劃,這項功能將允許本地模型在面對複雜查詢時,自動將部分運算轉移至 OpenAI 雲端模型進行輔助推理,從而平衡私隱保障與運算效能。有評論指出,該功能設計類似蘋果(Apple)於 2024 年推出的「Apple Intelligence」模型融合系統,顯示業界正朝向本地與雲端協同運算的方向發展。
業界觀察人士認為,OpenAI 是次開源舉動背後蘊藏戰略考量。一方面是回應外界對其模型封閉程度的批評,另一方面則是應對 Meta 推出的 Llama 3 開源系列,以及中國公司 DeepSeek 所帶來的市場壓力。Meta 最近亦宣布推出 Llama 專屬 API,進一步搶佔開發者市場。而 DeepSeek 則以低成本高效能模型迅速擴張,用戶覆蓋超過十個語言市場。
OpenAI 行政總裁 Sam Altman 曾在 Reddit 網上論壇上坦言,公司過去在開源問題上「可能站在歷史錯誤的一邊」,言論被視為此次政策調整的先兆。根據《彭博》(Bloomberg)分析,OpenAI 透過結合免費開源模型與商業雲端服務的模式,有望提升整體生態圈的黏性,並在不犧牲核心盈利來源的情況下,擴大全球開發者社群的參與度。