NVIDIA Nemotron 3 Nano Omni 热门新增

AI 开发平台免费

英伟达 2026年4月28日发布的开源全模态推理模型，30B总参数/3B激活的MoE架构，原生支持文本、图像、视频、音频四模态输入，Agent效率提升9倍

NVIDIA 开源多模态 MoE Agent 边缘计算

访问 NVIDIA Nemotron 3 Nano Omni 官网

免责声明：测评内容仅代表编辑个人观点和使用体验，不构成任何商业推荐或投资建议。产品信息和价格可能随时变动，请以官方最新信息为准。

产品简介

NVIDIA Nemotron 3 Nano Omni 是英伟达于2026年4月28日正式发布并开源的全模态推理模型，属于 Nemotron 3 系列的首款多模态成员。它采用 30B 总参数 / 3B 激活的混合 MoE（混合专家）架构，原生支持文本、图像、视频、音频四模态输入，以文本形式输出。该模型专为 Agentic AI 场景设计，能让 AI 智能体像人类一样「看、听、说、做」，被定位为企业级 AI 智能体的感官大脑。

**📌 补充信息**：Nemotron 3 系列还包含 **Nano / Super / Ultra 三种规模**，覆盖从边缘设备到超大规模服务器的全部部署场景。Nano Omni 的吞吐量比 **Nemotron 2 Nano 高 4 倍**。截至 2026 年 7 月无新版本 Nemotron 4 的官方发布信息。

核心功能

全模态统一推理：单一模型处理文本、图像、音频、视频、文档、图表和图形界面等多种输入，无需拼接多个独立模型
MoE 高效架构：30B 总参数但仅 3B 激活，动态路由按需调用专家模块，推理效率极高
9倍吞吐提升：相较同类开源多模态模型，吞吐性能提升9倍，大幅降低推理延迟
256K 超长上下文：支持最长 256K token 上下文窗口，适合处理长视频、长音频等复杂场景
边缘部署友好：4B 激活参数量可在 RTX 显卡笔记本或嵌入式设备上本地运行，适合隐私敏感场景
完全开源：权重和技术文档完全开放，支持在 HuggingFace 等平台获取，可自由部署和微调

适合谁用

以下类型的用户会特别受益于 NVIDIA Nemotron 3 Nano Omni：

企业级 AI 智能体（Agent）构建
多模态客服与交互系统
边缘设备上的实时视频/音频分析
医疗、金融等隐私敏感领域的本地部署
工业质检和视频监控的智能分析

优点亮点

全模态统一避免多模型切换的效率损耗
MoE 架构兼顾性能与推理成本
完全开源且支持商用
可在消费级 GPU 上本地运行
富士康、甲骨文、帕兰蒂尔等企业已率先采用

价格与方案

完全免费开源，权重可在 HuggingFace 和 NVIDIA NGC 获取。通过 NVIDIA API Catalog 也可直接调用云端推理服务。

总结与建议

Nemotron 3 Nano Omni 是英伟达在 Agentic AI 时代推出的重要基础模型，以极高的推理效率和全模态统一能力填补了开源社区在企业级多模态 Agent 底座方面的空白。适合需要本地部署、低延迟多模态推理的企业开发者。

NVIDIA Nemotron 3 Nano Omni 热门 新增