Google 機器人打乒乓球 打了三年還沒停 學習真實世界的複雜環境

在倫敦南部的 DeepMind 實驗室內,一場特殊的乒乓球比賽已經持續了三年之久。自 2022 年開始,兩隻由 Google DeepMind 開發的人工智慧驅動機器手臂,便展開了這場沒有終點的「延長賽」。不同於傳統競技,這場對戰並非為了爭奪勝負,而是透過無盡的交鋒,讓機器手臂從每一次擊球中學習新策略,逐步適應真實世界的複雜環境。研究團隊強調,這種「邊打邊學」的訓練模式,是推動機器人從實驗室走向實際應用的關鍵。

起初,這些機器手臂僅能進行簡單的來回擊球。工程師們逐步增加難度,引入競爭機制,讓手臂開始追求得分,並發展出多樣化的取分策略。然而,在這個過程中,機器人暴露出「邊學邊忘」的問題:當適應新戰術時,往往會遺忘舊有技巧,導致回合迅速結束。為了克服這一瓶頸,團隊邀請真人陪練。面對變化多端的人類對手,機器手臂表現得更為穩定,並制定了多樣策略。最終,在與人類進行的 29 場比賽中,機器手臂的勝率達到 45%,對中階玩家的勝率更升高至 55%,展現出「遇強則強」的學習能力。

為了進一步加速進步,DeepMind 團隊引入 Google Gemini 視覺語言模型,作為機器手臂的「AI 教練」。Gemini 能夠分析乒乓球對戰影片,提供如「朝右邊擊球」或「加強網前短球」等自然語言反饋,宛如真人教練在場邊指導。這項創新不僅讓機器手臂更快速調整策略,還大大提升了訓練效率。研究人員指出,選擇乒乓球作為訓練平台並非隨意。這項運動要求高速反應、精準動作控制以及多樣化策略,且設備成本低廉,非常適合培養通用型機器人的核心能力。

這場持續三年的乒乓球訓練,不僅是技術演示,更是通往未來智慧夥伴的橋樑。透過不斷累積實戰經驗,DeepMind 希望縮短機器人從實驗室到日常應用的距離。想像一下,未來的家庭、工廠或醫療環境中,這些機器人能靈活處理各種任務,成為人類可靠的助手。根據最新研究,這種自主學習模式已讓機器人在對抗業餘人類時達到可觀水準,預示著人工智慧在物理世界中的巨大潛力。

然而,挑戰依然存在。機器人需克服更多不確定因素,如環境變化或意外干擾。DeepMind 團隊表示,將繼續擴大訓練範圍,融入更多運動或日常任務,讓機器人更接近人類般靈活。隨著 Gemini 等模型的進化,這場「無盡比賽」或許將開啟人工智慧新紀元,讓機器人真正融入人類社會。

發佈時間: 2025年07月29日 17:17
關於我們 | 加入我們 | 隱私權聲明 | 免責聲明 | 錯誤回報/意見提供
電郵: hongkongmatters.info@gmail.com

Copyright © 2022 香港元宇宙. All rights reserved.