
人工智能正由雲端一路「落地」,走入真實世界,「實體AI」(Physical AI)成為全球科技圈最新焦點。AWS 年度大會 2025 本周於美國拉斯維加斯揭幕,大會首日其中一條最熱門嘅問題,就係機器人幾時先會迎來屬於自己嘅「ChatGPT時刻」,即係嗰種足以重新定義產品形態、引爆大規模應用嘅臨界點。
輝達機器人及邊緣運算生態系負責人喺主題座談中被直接問到呢個問題時,答案毫不含糊:要真正等到機器人嘅「ChatGPT時刻」,必須同時滿足兩個條件,缺一不可。
第一,硬件成本要出現結構性下跌,機器人要好似智能手機咁,變得真正「買得到、用得起」,先可能大規模普及。
第二,機器人嘅智能要「真係有用」,可以喺現實世界穩定、可靠咁完成任務,而唔係只停留喺展示或實驗層面。
Goel 形容,現時幾乎所有達成目標嘅「原料」都已到位,連「食譜」都齊晒,剩低嘅問題只係點樣將呢啲元素完美結合,以及時間點幾時成熟。他指出,大型語言模型已經喺數碼世界成功滲透到數以億計用戶,但實體AI面對嘅完全係另一種難題真實世界產生嘅資料唔止係文字,仲包括力道、觸感、深度、物理互動等極其複雜嘅資訊,意味住需要一整套全新工具,先可以令AI「學識點樣同現實互動」。
至於機器人會唔會好快好似手機一樣走入千家萬戶,他坦言短期內唔會出現「一部機械人包辦所有家務」嘅場面。不過,具備高度互動性、可以同人類自然協作嘅「伴侶型機器人」,仍然被業界視為最終嘅聖杯(holy grail)。要做到真正嘅通用型機器人智慧,就唔可以將機器長期困喺工廠,只做單一、重覆嘅工作,而係要放佢哋進入千變萬化嘅環境之中,呢一步亦正正係難度最高嘅地方。
AWS 生成式AI創新中心總監 Sri Elaprolu 則補充指,距離機器人大規模進入消費市場或家庭場景,最少仍然需要幾年時間。不過佢對前景保持樂觀,認為隨住實體世界數據被愈來愈系統化咁搜集,機器人用嘅視覺語言模型(VLM)將會快速進化;再加上硬件成本下降同效能飛躍,呢兩股力量有望喺未來幾年內匯合,推動實體AI進入真正嘅爆發期。
為咗加速呢股浪潮,AWS 大會期間同 MassRobotics 以及 NVIDIA Inception 合作,宣布啟動第二屆「實體AI獎學金」(Physical AI Fellowship)計畫。入選新創團隊除咗可以獲得頂尖科學家同業界專家一對一指導,亦可免費使用雲端AI技術堆疊及機器人軟件平台資源,加快由概念走向可量產產品。
業界普遍認為,2025 年正被視為實體AI嘅「基礎設施年」,由感測器、運算平台、模擬環境,到數據蒐集渠道,各個環節都加速成熟之中。包括 Tesla、Figure、Boston Dynamics 在內嘅巨頭同新創,正全面投入呢場競賽。
當硬件成本門檻被真正打破,而機器人又終於學識「好似人類咁理解並操作呢個世界」嘅一刻,人形機械人同各類專業機器人,就有機會重演 2022 年底 ChatGPT 橫空出世嘅情景,一夜之間改變人類生活。睇嚟機器人嘅 ChatGPT 時刻,已經唔再係「會唔會嚟」嘅問題,而係「幾時到」嘅問題。