大秀了一把厨艺后,斯坦福华人团队开发的机器人又在北京时间今日凌晨发布了新视频《Mobile ALOHA 的一天》,展示了浇花、打扫房间、煮咖啡、给主人刮胡子、洗碗、逗猫、扔垃圾、洗衣服、换被套、收纳衣物等数十种家务技能,堪称 全能家政员 。
长期以来,人们深受 莫拉维克悖论 (Moravecs paradox)的困扰,这是一种和人们直觉相悖的现象,即 人类觉得容易的任务对人工智能来说却极其困难,反之亦然 。
但别高兴得太早,Mobile ALOHA 虽然 眼里有活 了,但它的动作依然由人操控(见下图),并非完全智能的自主操作。
Mobile ALOHA 更大的意义在于,其运动控制能力比成本高出 5-10 倍的同类系统更强大,展示了通用机器人的可行性,一个便宜、好用的家用机器人或许很快将会到来。kaiyun网站
据上述华人团队介绍,仅用 50 个演示,就能让 Mobile ALOHA 完成各种复杂任务,其成本仅为 32000 美元(约 22 万元),软件和硬件全部开源。
该团队在论文中详细介绍了 Mobile ALOHA 的硬件配置——最贵的是机械臂和移动底座,其中移动底座选择了同类产品中相对便宜的一款;传感器方面配备了 2 个腕部摄像头和 1 个顶部摄像头;配有机载电源和计算,即 1.26 千瓦时重 14 公斤的电池,在数据收集和推理过程中的所有计算都在一台消费级笔记本电脑上进行,该笔记本电脑配有英伟达 3070ti GPU (8gb VRAM)和英特尔 i7-12800H。
英伟达 网红研究员 、OpenAI 第一个实习生 Jim Fan 此前乐观预测,2024 年将成为人工智能界全面崛起反击莫拉维克悖论的元年, 我们不会立即获胜,但我们将走上获胜之路 。
这并非一时 口嗨 ,如今产业面的各种进展层出不穷,Jim 列举了 2023 年关于未来机器人的基础模型和平台的发展:
2、弥合 System 1(负责低级控制)和 System 2(负责高级推理)之间差距的算法(使得系统能够利用高级推理进行决策和理解,并将这些决策转化为实际的操作和控制):Eureka(英伟达)、Code as Policies(谷歌)等;
4、数据一直是机器人技术的致命弱点,研究界正在共同策划下一个 ImageNet(人工智能深度学习取得突破的关键项目),如开放 Open X-Embodiment ( RT-X ) 数据集。虽然数据集还不够多样化,但迈出了重要的一步;
5、模拟和合成数据将在解决机器人灵巧性乃至整个计算机视觉问题上发挥关键作用;
基础正一步步被夯实,站在 2024 年的年头,我们有理由期待更强大的机器人惊艳亮相。