英伟达最新项目GR00T突破让机器人像人类一样学习AI终于可以quot复制quot人类
机器人终于要像人类一样学习了?
NVIDIA最新GR00T项目有了突破性进展, AI复制人类行为 的时代来了!
NVIDIA高级研究经理Jim Fan最近在Twitter上透露了他们团队在Project GR00T上的最新突破。

这个项目旨在解决 机器人学习中最痛苦的痛点 ——数据不足问题。
他们的想法很简单:
让人类在真实机器人上收集示范数据,然后在模拟环境中将这些数据 放大1000倍甚至更多 !
听起来很酷对吧?我们一步步拆解下这个过程:
1. Apple Vision Pro来助阵
没错,就是那个让果粉们垂涎已久的空间计算神器!

在这个项目中,Vision Pro被用来给人类操作者提供 第一视角的控制 。它可以实时解析人手的姿势,并将动作精准映射到机器人手上。
Jim Fan表示,从人类的角度来看,这就像是 Avatar电影里的场景 ,你的意识被转移到了另一具身体里。
虽然这种远程操作方式比较慢,耗时也长,但他们只需要收集少量数据就够了。
2. RoboCasa:虚拟环境的魔法师
接下来,他们使用了一个叫RoboCasa的生成式模拟框架,来 成倍增加示范数据 。

它通过改变环境的视觉外观和布局来实现这一点。就像Jensen的演示视频中展示的那样,人形机器人现在可以在 数百个不同的厨房 里放置杯子,这些厨房有着各种各样的纹理、家具和物品摆放。
Jim笑称:
我们在NVIDIA总部的GEAR实验室里只有一个真实的厨房,但在模拟中,我们可以召唤出无限多个!
3. MimicGen:动作的"复制粘贴"大师
最后一步,他们应用了MimicGen技术,通过 改变机器人的动作 来进一步扩充数据集。

MimicGen基于原始的人类数据生成大量新的动作轨迹,然后过滤掉失败的尝试(比如那些把杯子摔了的),最终形成一个更大的数据集。

总结一下,整个过程是这样的:
1个人类轨迹(通过Vision Pro采集)
→ RoboCasa产生N个(改变视觉效果)
→ MimicGen进一步扩增到NxM个(改变动作)
Jim表示,这种方法可以用 GPU加速的模拟来换取昂贵的人类数据 。
他还提到,之前他曾说过远程操作从根本上是不可扩展的,因为我们总是被现实世界中每天24小时/每个机器人的限制所束缚。而现在,GR00T的合成数据管道打破了这个限制。
Jim兴奋地说:
大语言模型的规模化一直很有趣,现在终于轮到我们机器人领域也来玩玩了!我们正在构建工具,让生态系统中的每个人都能和我们一起扩大规模。
看到这里,有网友表示 担心:
听起来很酷,但这会不会让机器人变得太"人性化"了?毕竟人类也有很多缺点,希望AI别学到那些bad habits。
也有理性派网友指出:
模拟数据再好,终究还是要在真实世界验证的。希望NVIDIA能在sim2real(模拟到现实)方面多下功夫。
更多人则对这项技术的前景感到兴奋:
这简直就是为机器人界量身打造的GPT!如果能成功,机器人的学习能力将会有质的飞跃。
确实,如果这项技术能够成功推广, 机器人的学习方式将会发生革命性的变化 。
它不仅能大大降低机器人学习的成本,还能让机器人更快速、更精准地掌握各种复杂的技能。
想象一下,以后我们可能只需要向机器人示范一两次,它就能 自主学习并完成各种复杂的任务 。
这对于工业生产、医疗护理、家庭服务等多个领域都将产生许多影响。
而在英伟达的 另一 边,则是马斯克对Optimus 的志在必得!见前文 : 特斯拉机器人Optimus 最新进展:利用端到端神经网络实现多项任务自动化。
马斯克甚至曾放言, 未来机器人与人类的数量将达到4:1!
那么问题来了:
英伟达的具身智能和特斯拉的optimus 机器人,你更看好谁呢?
欢迎在评论区留言讨论!
版权声明:
作者:clash
链接:https://www.shadowrocket6.top/96.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论