新聞透視·延伸閱讀|當機械人擁有身體與大腦:甚麼是「具身智能」?
發佈日期: 2026-05-03 16:00
港澳


人工智能(AI)的發展正迎來一場革命性轉變。香港創新科技及工業局局長孫東教授在立法會上透露,政府新成立的「AI+與產業發展策略委員會」初期將聚焦生命健康及「具身智能」。究竟甚麼是「具身智能」? ▍ 從機械臂到會思考的機械人 簡單來說,傳統AI像是一個只有「大腦」的專家,只能在電腦中處理數據、解答問題;而具身智能則為這個大腦配上「身體」,讓它能夠走進真實世界,透過鏡頭、傳感器、機械臂等物理軀體感知環境、與物件互動,並自主學習和適應。換言之,傳統AI是「在計算機中思考」,具身智能是「走進真實世界學習」。 中大機械與自動化工程學系助理教授陳翡舉例指,如果想讓機械人演奏樂器,它們就需要非常靈巧的手指、能互相配合的雙臂,甚至人工智能大腦的驅動。他又指,假如能組建機械人樂隊,就可以為人們帶來歡樂。 機械人的發展歷程,正是人類追求「機器智能」的縮影。上世紀五十年代,第一台工業機械臂只能按預設程序重複勞動,對外界環境變化沒有適應能力,被形容為「沒有大腦的軀體」。 到了九十年代,隨著傳感器技術進步,機械人開始配備攝影機和紅外線,能夠感知環境並作出簡單反應,例如掃地機械人可自主避開障礙物。 進入2010年代,移動互聯網和深度學習的爆發,讓機械人升級為能夠與人語音交互的「協作者」,例如酒店配送機械人、語音助手等。然而,這些機械人的智能仍然依賴預設規則,一旦遇到程序沒有設定的情況,往往就會「卡住」。 ▍ 大模型成為具身智能的「大腦」 真正的突破發生在2022年之後。大型語言模型的出現,為機械人裝上了一顆強大的「大腦」。以往,機械人要完成「把桌上的蘋果遞給我」這個指令,需要程式設計師預先編寫大量關於圖像識別、空間定位和力度控制的代碼。如今,結合大模型的機械人,能夠理解自然語言、認出蘋果的視覺特徵,並自行規劃出最佳的抓取路徑。 研究人員更透過「具身微調」技術,在虛擬環境中讓大模型控制虛擬機械人反覆試錯,透過強化學習優化動作策略,再將經驗遷移到真實世界,大大縮短了訓練時間。 ▍ 具身智能的四大前沿趨勢 具身智能正朝著「更像人」的方向快速進化。第一,多模態融合感知,機械人不再依賴單一傳感器,而是像人類一樣結合視覺(高清鏡頭、激光雷達)、觸覺(柔性壓力傳感器)甚至聽覺,同時感知環境,可辨認物體材質是軟是硬、地面是否濕滑。 第二,自主化學習能力,機械人能透過觀察人類煮飯的影片,自主模仿學會使用菜刀和鍋鏟,無須人手編程。 第三,人機協作能力,在工廠環境中,機械人可與工人無縫配合,工人用手勢示意「這裏需要擰緊螺絲」,機械人便立即調整工具角度完成操作。 第四,柔性化與仿生設計,機械人從剛硬的金屬結構進化出如章魚般柔軟的肢體,能夠鑽進狹窄管道進行檢測;仿生手更可透過肌電傳感器感知人類手臂肌肉信號,實現「意念控制」抓取。 ▍ 技術突破背後的五大關鍵 要實現這些能力,需要在五大核心技術領域取得突破: 1)多模態感知技術讓機械人具備視覺、觸覺、聽覺等感知能力; 2)運動控制與驅動技術則負責仿生關節的靈活動作和力度控制; 3)決策與智能算法通過強化學習、遷移學習和因果推理,讓機械人懂得「試錯」和舉一反三; 4)能源與材料技術提供高密度電池和柔性材料,確保機械人的續航力與安全性; 5)人機交互技術則涵蓋自然語言對話、手勢識別和表情識別,讓人與機械人的溝通更直觀。 ▍ 法律挑戰:誰來為機械人的行為負責? 隨著具身智能從實驗室走向實際應用,一系列法律與倫理問題逐漸浮現。例如,家庭服務機械人持續記錄的居住者生活習慣數據,所有權和使用權歸誰?當一台自主決策的手術機械人失誤導致病人受傷,責任應屬開發者、使用者還是機械人本身?若安保機械人透過自主學習認為「暴力制服更高效」,是否逾越了「不傷害人類」的倫理紅線?此外,具身智能涉及硬件專利、算法著作權、訓練數據權屬的融合,一旦產生收益,如何在不同主體之間公平分配? 專家建議從多個維度應對這些挑戰。立法層面可制定專門法規,界定數據收集邊界(如禁止機械人在臥室安裝攝像頭),並按自主決策程度將責任劃分為「完全人工控制」、「半自主」和「全自主」三級。監管方面可按應用場景風險等級分類管理,工業機械人屬低風險,醫療及養老機械人屬中風險,安保及軍事機械人屬高風險,後者需通過安全認證方可上市。行業亦應制定技術標準,要求機械人記錄決策過程以便追溯。倫理指南則應明確「不得設計具有自主傷害能力的機械人」、「禁止利用機械人從事非法監控」等底線原則。
