英伟达最新项目GR00T突破让机器人像人类一样学习AI终于可以quot复制quot人类

机器人终于要像人类一样学习了?

NVIDIA最新GR00T项目有了突破性进展, AI复制人类行为 的时代来了!

NVIDIA高级研究经理Jim Fan最近在Twitter上透露了他们团队在Project GR00T上的最新突破。

英伟达最新项目GR00T突破让机器人像人类一样学习AI终于可以quot复制quot人类-2

这个项目旨在解决 机器人学习中最痛苦的痛点 ——数据不足问题。

他们的想法很简单:

让人类在真实机器人上收集示范数据,然后在模拟环境中将这些数据 放大1000倍甚至更多 !

听起来很酷对吧?我们一步步拆解下这个过程:

1. Apple Vision Pro来助阵

没错,就是那个让果粉们垂涎已久的空间计算神器!

英伟达最新项目GR00T突破让机器人像人类一样学习AI终于可以quot复制quot人类-3

在这个项目中,Vision Pro被用来给人类操作者提供 第一视角的控制 。它可以实时解析人手的姿势,并将动作精准映射到机器人手上。

Jim Fan表示,从人类的角度来看,这就像是 Avatar电影里的场景 ,你的意识被转移到了另一具身体里。

虽然这种远程操作方式比较慢,耗时也长,但他们只需要收集少量数据就够了。

2. RoboCasa:虚拟环境的魔法师

接下来,他们使用了一个叫RoboCasa的生成式模拟框架,来 成倍增加示范数据 。

英伟达最新项目GR00T突破让机器人像人类一样学习AI终于可以quot复制quot人类-4

它通过改变环境的视觉外观和布局来实现这一点。就像Jensen的演示视频中展示的那样,人形机器人现在可以在 数百个不同的厨房 里放置杯子,这些厨房有着各种各样的纹理、家具和物品摆放。

Jim笑称:

我们在NVIDIA总部的GEAR实验室里只有一个真实的厨房,但在模拟中,我们可以召唤出无限多个!

3. MimicGen:动作的"复制粘贴"大师

最后一步,他们应用了MimicGen技术,通过 改变机器人的动作 来进一步扩充数据集。

英伟达最新项目GR00T突破让机器人像人类一样学习AI终于可以quot复制quot人类-5

MimicGen基于原始的人类数据生成大量新的动作轨迹,然后过滤掉失败的尝试(比如那些把杯子摔了的),最终形成一个更大的数据集。

英伟达最新项目GR00T突破让机器人像人类一样学习AI终于可以quot复制quot人类-6

总结一下,整个过程是这样的:

1个人类轨迹(通过Vision Pro采集)

→ RoboCasa产生N个(改变视觉效果)

→ MimicGen进一步扩增到NxM个(改变动作)

Jim表示,这种方法可以用 GPU加速的模拟来换取昂贵的人类数据 。

他还提到,之前他曾说过远程操作从根本上是不可扩展的,因为我们总是被现实世界中每天24小时/每个机器人的限制所束缚。而现在,GR00T的合成数据管道打破了这个限制。

Jim兴奋地说:

大语言模型的规模化一直很有趣,现在终于轮到我们机器人领域也来玩玩了!我们正在构建工具,让生态系统中的每个人都能和我们一起扩大规模。

看到这里,有网友表示 担心:

听起来很酷,但这会不会让机器人变得太"人性化"了?毕竟人类也有很多缺点,希望AI别学到那些bad habits。

也有理性派网友指出:

模拟数据再好,终究还是要在真实世界验证的。希望NVIDIA能在sim2real(模拟到现实)方面多下功夫。

更多人则对这项技术的前景感到兴奋:

这简直就是为机器人界量身打造的GPT!如果能成功,机器人的学习能力将会有质的飞跃。

确实,如果这项技术能够成功推广, 机器人的学习方式将会发生革命性的变化 。

它不仅能大大降低机器人学习的成本,还能让机器人更快速、更精准地掌握各种复杂的技能。

想象一下,以后我们可能只需要向机器人示范一两次,它就能 自主学习并完成各种复杂的任务 。

这对于工业生产、医疗护理、家庭服务等多个领域都将产生许多影响。

而在英伟达的 另一 边,则是马斯克对Optimus 的志在必得!见前文 : 特斯拉机器人Optimus 最新进展:利用端到端神经网络实现多项任务自动化。

马斯克甚至曾放言, 未来机器人与人类的数量将达到4:1!

那么问题来了:

英伟达的具身智能和特斯拉的optimus 机器人,你更看好谁呢?

欢迎在评论区留言讨论!

版权声明:
作者:clash
链接:https://www.shadowrocket6.top/96.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>