輝達Nvidia再度加快AI布局,宣布推出全新開源模型 Nemotron 3 Nano Omni,主打語音、影像、文字與推理能力整合,目標鎖定企業導入AI智能體(AI Agent)的實際應用需求。
這款新模型被輝達定位為「面向代理式AI的生產級開放模型」,也就是不只用來聊天,而更是希望協助企業打造出一個能夠理解資料、執行任務、操作工具的AI系統。
輝達表示,Nemotron 3 Nano Omni可讓AI智能體的工作效率提升至9倍,顯示輝達正從GPU晶片與算力供應商角色,進一步擴大到AI模型、開發工具以及企業解決方案領域。
過去許多多模態AI系統,通常是把不同功能的模型組合在一起,例如一個模型看圖片、一個模型聽語音、另一個模型則處理文字。今日Nemotron 3 Nano Omni的不同功能之處,在於它希望用「一個模型」整合出多種資料型態,讓AI可以同時用來理解文字、圖像、音訊與影片內容,並在同一套架構下,直接進行分析與推理。
這樣的能力對於企業工作應用上是相當重要。舉例來說,企業每天會產生大量文件、會議錄音、客服紀錄、影片資料以及系統畫面等工作,如果AI能一次理解不同形式的內容,就能很快協助整理出重點、擷取資訊、判斷問題,甚至進一步提出下一步工作方向建議。
在技術架構上,Nemotron 3 Nano Omni延續Nemotron 3系列的混合設計,結合Transformer與Mamba機制,並導入混合專家模型(MoE)架構。簡單來說,這些設計是為了讓模型在維持理解與推理能力下,降低運算成本,讓企業在實際部署AI時,能夠更有效率,也更容易控制其營運成本。
輝達這次推出的新模型,真正的目標並不是一般聊天機器人,而是企業正在積極導入的AI智能體系。這類AI不只是回答問題,還可以協助完成多項步驟任務,例如整理文件、處理表單、查找資料、操作軟體、分析工作流程,甚至協助客服人員處理相關的複雜案件。

Nemotron 3 Nano Omni應用於理解、多步驟推理與工具調用,代表它還可以閱讀較長的資料內容,也能夠按照任務需求項目來處理問題。
此外,輝達也導入GUI訓練資料,讓AI能夠理解電腦軟體介面中的按鈕、選單與畫面元素等功能,未來可望應用在自動化辦公、軟體操作、企業流程管理以及客戶服務等需求場景。
目前已經有多家企業開始採用或評估這款新模型。輝達表示,富士康、Palantir、Aible、ASI、Eka Care、H Company與Pyler等公司已經開始採用AI模型Nemotron 3 Nano Omni;戴爾(Dell)、DocuSign、Infosys、K-Dense、Lila、甲骨文(Oracle)與Zefr等企業則正在評估導入可能性。
市場人士認為,輝達所推出的全新「AI模型Nemotron 3 Nano Omni」,代表AI競爭已經不只是晶片效能之爭,也更進一步延伸到模型平台、企業應用與AI Agent生態系。隨著企業加速導入AI,自動化流程、資料整合與跨模態理解能力,將可望成為未來AI落實應用的重要關鍵。