發佈: 2026-04-07 07:30
撰文: 無綫新聞
Google DeepMind 推出的 Gemma 4 包含四個開放權重模型,皆可容納於單張 Nvidia GPU 上,允許用戶離線使用,無需將敏感資料傳至雲端。其功能採用 Agent Skills,可預設任務指令以節省用戶時間,並能在裝置端執行多步驟自主工作流程,存取初始訓練資料以外的資訊,支援將段落或影片轉為摘要、將數據轉為互動式圖表,並兼容超過140種語言。然而,Gemma 4 存在推論速度不足的問題,尤其260億參數的混合專家模型在部分硬體上處理速度未達預期,且與現有工具鏈整合尚不穩定。其上下文窗口為25.6萬 token,雖不小但遠低於競爭對手如 Meta 的 Llama 4 Scout 的1000萬 token 和阿里巴巴千問 Qwen 的100萬 token,這對處理極長文件或完整程式碼庫的場景影響顯著。此次發布標誌著 Google 與 Nvidia 在開源模型領域的深度戰略合作,讓 Google 模型能直接應用於普及的 Nvidia GPU 平台,而 Nvidia 則獲得高效能開源模型以推動企業購買 GPU。前代 Gemma 系列已累積四億次下載,Gemma 4 能否將關注度轉為大規模應用,取決於 Google 及其合作夥伴解決速度與工具鏈整合問題的速度。





