AI智慧機器人再進化!Google發表可離線運作的Gemini On-Device模型

▲GEMINI機器人技術(Google DeepMind)

記者吳立言/綜合報導

Google DeepMind宣布推出全新語言視覺動作模型「」,這是公司首次針對機器人端設計、可於本地運行的先進AI模型。該模型可在無網路環境下執行複雜指令與精細操作,標誌著AI機器人正式邁入「邊緣智慧」新時代。

Gemini Robotics On-Device建基於今年三月推出的Gemini Robotics模型,延續其視覺、語言與動作(VLA)整合能力,並針對本地裝置最佳化運算效率與延遲表現。Google表示,該模型可執行如解拉鍊、摺衣、工業裝配等任務,同時維持對自然語言指令的高度理解與泛化能力。

Gemini On-Device模型專為延遲敏感場景與無網環境設計,不僅實現即時反應,更提升系統穩定性。根據Google測試,該模型在未曾見過的任務與物件中,仍展現高水準泛化與行為一致性,超越目前其他本地推論模型。目前該模型支援包括雙臂機器人Franka FR3與Apptronik所開發的人形機器人Apollo,在兩者平台上皆能完成組裝、倒醬、畫圖等高靈巧度動作,顯示其良好的平台轉移能力(embodiment generalization)。

為便利開發者使用,Google同步釋出Gemini Robotics SDK,提供MuJoCo模擬器整合,支援快速原型開發與低資源微調。開發者僅需提供50至100次任務示範,即可訓練模型執行新操作,大幅降低訓練資料需求。

Gemini On-Device也是Google首次開放微調的VLA模型,支援自然語言提示與範例導向訓練,進一步強化個別任務的表現。Google表示,該模型的開發符合公司AI原則,並搭配Live API與安全控制器確保語意與物理層級的安全性。此外,Google設立「責任與安全委員會(RSC)」審查模型在實際應用中的影響與風險,並建議開發者進行完整紅隊測試。

目前Gemini Robotics On-Device僅開放予信任測試者申請使用。Google強調將透過小規模釋出,收集更多實際應用回饋,未來視測試成果逐步擴大開放。


標題:AI智慧機器人再進化!Google發表可離線運作的Gemini On-Device模型

聲明: 本文版權屬原作者。轉載內容僅供資訊傳遞,不涉及任何投資建議。如有侵權,請立即告知,我們將儘速處理。感謝您的理解。

分享你的喜愛