香港新聞連線

GPT-4.5係GPT-5次貨版 OpenAI走佬潮成研發死因

OpenAI 嘅最新旗艦模型 GPT-5 研發進度備受關注，但據外媒爆料，其開發過程飽受多重阻力困擾——技術突破有限、核心人才流失，加上內部管理混亂，令進展大打折扣。相比 GPT-3 到 GPT-4 嘅大躍進，GPT-5 只實現咗溫和提升，未能迎合外界對顛覆性革命嘅高期待。

最初，OpenAI 曾寄望名為「Orion」嘅模型成為新一代旗艦產品，但測試結果顯示效能遠低於預期，最終被降格為 GPT-4.5，並於 2025 年 2 月低調面世。雖然模型喺編程同數學推理方面有啲進步，但表現距離顛覆標準仍有一段距離，迅速喺公眾視野中退場。

「Orion」失利嘅主因係高質預訓練數據短缺。隨住互聯網優質內容越來越稀缺，過去用喺中小型模型嘅訓練方法，喺大型語言模型上效果大打折扣，限制咗性能突破。呢次失敗嚴重打擊 GPT-5 嘅信心，OpenAI 被迫重新部署策略。

同時間，內部人事震盪令局勢雪上加霜。Meta 大舉高薪挖角，奪走多位核心研究人員，重創 OpenAI 嘅技術陣容。研究副總裁 Jerry Tworek 曾喺內部通訊中公開表示對團隊穩定性感到憂慮，更一度考慮放假思考未來方向，雖然最後無放，但事件突顯管理壓力爆煲。

另一方面，OpenAI 與長期夥伴微軟嘅合作關係亦現分歧。不少資深研究員對將成果轉交微軟感到保留，雙方喺技術共享同財務安排上爭議不斷。據悉，OpenAI 最近重組咗營利部門後，微軟或將持股高達 33%，令公司內部矛盾加劇。

儘管 GPT-5 未見突破，推理模型嘅意外成功為 OpenAI 帶來一線曙光。早喺 2023 年底，「Q*」技術內部測試顯示具備解答複雜數學問題嘅潛力，為語言模型推理能力開拓新方向。其後，OpenAI 於 2024 年秋推出第一款推理模型「o1」，年底再推進階版「o3」。

「o3」基於 GPT-4o 架構，喺理解複雜知識上表現明顯優勝，背後功臣之一正係輝達晶片提供嘅強大算力支持，仲有開放對網絡搜尋同程式碼庫嘅存取權限，大幅提升知識獲取與應用能力。OpenAI 更首次喺 o3 訓練中引入強化學習，涵蓋生物、醫學、軟件工程等多領域問題，讓模型生成大量解法，再從中選出與人類專家觀點一致嘅「合成資料」進行優化訓練。呢種方法，被視為下一代語言模型提升嘅關鍵。

然而，當「o3」被轉化成對話型產品時，其推理能力明顯下降，反映 OpenAI 仍未完全解決模型架構同推理整合嘅技術瓶頸，亦突顯 GPT-5 所面對嘅挑戰依然嚴峻。

儘管 GPT-5 表現未如預期，OpenAI 高層對未來依然樂觀。行政總裁 Sam Altman 多次公開表示，目前技術架構具備實現通用人工智慧（AGI）潛力，並透露公司正積極朝 GPT-8 級別邁進。有微軟工程師指出，新一代模型即使喺相同算力下，仍可產生更高質素嘅程式碼與文字，顯示效率同能力齊齊提升。

GPT-5 嘅難產顯示出大型語言模型喺數據、算力同人才三方面都面臨嚴峻挑戰，但推理模型嘅突破，加上輝達硬件支持，為 OpenAI 指出新方向。雖然 GPT-5 未成為「下一代顛覆者」，但其技術積累與組織調整，有望為 GPT-8 同未來更高階模型打好基礎。

發佈時間: 2025年08月04日 15:09