ChengRang

NVIDIA SpatialClaw 热门 新增

AI 开发平台 🆓 免费

NVIDIA Research 2026/6/19 发布的免训练空间推理框架,将「代码作为动作接口」让智能体调用感知工具,解决 VLM 在 3D 空间判断上的弱点;20 项基准平均准确率 59.9%,比近期智能体高 11.2 个百分点

NVIDIA 空间推理 免训练 3D Agent
🔗 访问 NVIDIA SpatialClaw 官网 →

免责声明:测评内容仅代表编辑个人观点和使用体验,不构成任何商业推荐或投资建议。产品信息和价格可能随时变动,请以官方最新信息为准。

📢 关注公众号,AI 新工具第一时间知道

每周精选值得关注的 AI 工具评测与行业动态
新产品上线、重大更新、使用技巧,不错过任何一个提升效率的机会

公众号二维码

📖 产品简介

SpatialClaw 是 NVIDIA Research 2026/6/19 发布的**免训练空间推理框架**,专门解决 VLM(视觉语言模型)在 **3D 空间判断**上的弱点。核心思路:**把代码作为动作接口(Code-as-Action)**——不让 VLM 直接给出空间答案,而是让它生成代码调用各种感知工具(深度估计、平面检测、目标检测、点云处理等),用代码的精确性补齐自然语言的模糊性。

效果直观:**在 20 项空间推理基准上平均准确率 59.9%,比近期智能体高 11.2 个百分点**。最关键的是「**免训练**」——不需要 fine-tune 任何模型,直接套在现有 GPT-5.5 / Claude Opus 4.7 / Gemini 3.5 上即可获得提升。

这是 NVIDIA「**让通用 VLM 在 3D 物理世界里更靠谱**」战略的一部分,与具身智能(Isaac、GR00T)、自动驾驶(DRIVE)形成生态联动。对所有做机器人、自动驾驶、AR/VR、3D 重建的团队都是直接利好。

⚡ 核心功能

🎯 适合谁用

以下类型的用户会特别受益于 NVIDIA SpatialClaw:

✅ 优点亮点

💰 价格与方案

**免费 + 开源**(GitHub 公开),NVIDIA Research 不直接收费。**底层 VLM API 费用**走开发者自有的 OpenAI / Anthropic / Google / NVIDIA NIM 账号。

📝 总结与建议

SpatialClaw 是 2026 年 VLM 空间推理赛道的代表性成果——**免训练 + 代码作动作接口 + 20 项基准 +11.2pp** 的组合让它对所有做机器人、自动驾驶、AR/VR 的团队都是直接利好。如果你在做物理世界 AI 应用,SpatialClaw 几乎是无脑值得叠加的工具;如果你做纯文本 / 图像理解,则不在它的射程内。

分类
AI 开发平台
价格
🆓 免费
标签
NVIDIA · 空间推理 · 免训练