GPT-4.5係GPT-5次貨版     OpenAI走佬潮成研發死因
GPT-4.5係GPT-5次貨版 OpenAI走佬潮成研發死因

OpenAI 嘅最新旗艦模型 GPT-5 研發進度備受關注,但據外媒爆料,其開發過程飽受多重阻力困擾——技術突破有限、核心人才流失,加上內部管理混亂,令進展大打折扣。相比 GPT-3 到 GPT-4 嘅大躍進,GPT-5 只實現咗溫和提升,未能迎合外界對顛覆性革命嘅高期待。

最初,OpenAI 曾寄望名為「Orion」嘅模型成為新一代旗艦產品,但測試結果顯示效能遠低於預期,最終被降格為 GPT-4.5,並於 2025 年 2 月低調面世。雖然模型喺編程同數學推理方面有啲進步,但表現距離顛覆標準仍有一段距離,迅速喺公眾視野中退場。

 

「Orion」失利嘅主因係高質預訓練數據短缺。隨住互聯網優質內容越來越稀缺,過去用喺中小型模型嘅訓練方法,喺大型語言模型上效果大打折扣,限制咗性能突破。呢次失敗嚴重打擊 GPT-5 嘅信心,OpenAI 被迫重新部署策略。

同時間,內部人事震盪令局勢雪上加霜。Meta 大舉高薪挖角,奪走多位核心研究人員,重創 OpenAI 嘅技術陣容。研究副總裁 Jerry Tworek 曾喺內部通訊中公開表示對團隊穩定性感到憂慮,更一度考慮放假思考未來方向,雖然最後無放,但事件突顯管理壓力爆煲。

另一方面,OpenAI 與長期夥伴微軟嘅合作關係亦現分歧。不少資深研究員對將成果轉交微軟感到保留,雙方喺技術共享同財務安排上爭議不斷。據悉,OpenAI 最近重組咗營利部門後,微軟或將持股高達 33%,令公司內部矛盾加劇。

儘管 GPT-5 未見突破,推理模型嘅意外成功為 OpenAI 帶來一線曙光。早喺 2023 年底,「Q*」技術內部測試顯示具備解答複雜數學問題嘅潛力,為語言模型推理能力開拓新方向。其後,OpenAI 於 2024 年秋推出第一款推理模型「o1」,年底再推進階版「o3」。

「o3」基於 GPT-4o 架構,喺理解複雜知識上表現明顯優勝,背後功臣之一正係輝達晶片提供嘅強大算力支持,仲有開放對網絡搜尋同程式碼庫嘅存取權限,大幅提升知識獲取與應用能力。OpenAI 更首次喺 o3 訓練中引入強化學習,涵蓋生物、醫學、軟件工程等多領域問題,讓模型生成大量解法,再從中選出與人類專家觀點一致嘅「合成資料」進行優化訓練。呢種方法,被視為下一代語言模型提升嘅關鍵。

然而,當「o3」被轉化成對話型產品時,其推理能力明顯下降,反映 OpenAI 仍未完全解決模型架構同推理整合嘅技術瓶頸,亦突顯 GPT-5 所面對嘅挑戰依然嚴峻。

儘管 GPT-5 表現未如預期,OpenAI 高層對未來依然樂觀。行政總裁 Sam Altman 多次公開表示,目前技術架構具備實現通用人工智慧(AGI)潛力,並透露公司正積極朝 GPT-8 級別邁進。有微軟工程師指出,新一代模型即使喺相同算力下,仍可產生更高質素嘅程式碼與文字,顯示效率同能力齊齊提升。

GPT-5 嘅難產顯示出大型語言模型喺數據、算力同人才三方面都面臨嚴峻挑戰,但推理模型嘅突破,加上輝達硬件支持,為 OpenAI 指出新方向。雖然 GPT-5 未成為「下一代顛覆者」,但其技術積累與組織調整,有望為 GPT-8 同未來更高階模型打好基礎。

發佈時間: 2025年08月04日 15:09
關於我們 | 加入我們 | 隱私權聲明 | 免責聲明 | 錯誤回報/意見提供
電郵: hongkongmatters.info@gmail.com

Copyright © 2022 香港元宇宙. All rights reserved.