5

前华为“天才少年”入局,具身智能新赛开场

 1 year ago
source link: https://cn.technode.com/post/2023-08-18/agibot/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

由前华为“天才少年”稚晖君创建的智元机器人于今日正式发布了一款具身智能产品“远征 A1”。在直播现场,稚晖君表示远征 A1将首先用于新能源制造、3C 制造等场景,目前正在与头部企业进行对接。

稚晖君原名彭志辉,他的成名始于2020年参与华为“天才少年”项目。公开资料显示,华为“天才少年”的税前年薪分三档,最高档182万元至201万元、第二档140.5万元至156.5万元、第三档89.6万至100.8万元。目前只有7人拿到过最高档年薪201万元,稚晖君就在其中。

在入职华为之前,稚晖君通过B站展示了其机械臂Dummy、自动驾驶自行车等作品。在被曝出从华为离职后,其表示“传言不虚,细节不表,接下来我会开启一段新的事业,去做更有挑战的事情”。

agibot-1.jpg

秘密浮出水面

今年2月,稚晖君的创业公司智元机器人(Agibot)正式成立。

公开资料显示,公司专注于发展通用人形机器人和具身智能的公司,致力于以AI和机器人的深度融合,长期投入打造有竞争力的机器人产品和生态。愿景是创造具有高度智能和实用价值,可以在现实世界为人类提供劳动力服务的下一代量产型机器人产品。

4月1日,拖更许久的稚晖君终于更新了一期B站视频,展示了自制的全新双足机器人哪吒。并表示在通用机器人和大模型的结合上,团队也会有一些动作。

三天后,稚晖君在微博上发布招聘信息,希望志同道合的伙伴加入,一起推动AGI机器人的实现。他表示,现在AI正在往AGI圣杯的方向加速迈进,LLM+Robotics的组合已是必然趋势,机器人会很快迎来应用场景爆发的拐点。

5月底,智元机器人获得了BV百度风投、经纬创投、鼎辉资本、高榕资本等知名机构的投资。公司注册资本增至4847万,投后估值据称已达十几亿美元左右,来到独角兽规模。

今日上午,稚晖君作为CTO揭晓了这款大模型加持下的智元具身智能机器人远征 A1。其身高 175cm,整体采用类人型造型。这台机器人拥有超过 49 个自由度,其中机器人手部拥有 12 个主动自由度,5 个被动自由度。同时手部配有指尖摄像头可以分辨操作物的颜色、形状、材质等。远征 A1号称拥有 200TOPS 算力,配有 RGBD 相机、激光雷达等元件。

agibot-2.jpg

在稚晖君看来,语言和图像大模型对机器人领域应用的可观价值,第一个是庞大的先验知识库和强大的通识理解能力;第二个则是在于复杂语义多级推理能力,即所谓的思维链。二者融合,就可以在各种复杂场景下自主完成移动和操作任务,即远征A1的未来计划。

为了实现这一点,智元团队对百亿级别的开源大模型进行了调优,形成WorkGPT。然后在基础上进行架构,将这个大模型的能力接入远征A1,使其具备理解人的指令,并对指令进行任务编排、执行闭环的能力。在外观检测、3C装配、物料搬运等不同的应用场景,大模型都会跟远征A1进行能力适配。

对抗莫拉维克悖论

由汉斯·莫拉维克(Hans Moravec)、罗德尼·布鲁克斯(Rodney Brooks)、马文·闵斯基(Marvin Minsky)等人于20世纪80年代提出的莫拉维克悖论(Moravec’s paradox)指出:和传统假设不同,对计算机而言,实现逻辑推理等人类高级智慧只需要相对很少的计算能力,而实现感知、运动等低等级智慧却需要巨大的计算资源。

也就是说,让计算机在智力测试或者下棋中展现出一个成年人的水平是相对容易的,但是要让计算机有如一岁小孩般的感知和行动能力却是相当困难甚至是不可能的。

为了对抗莫拉维克悖论,国内外许多公司都加大了对更具智能的机器人的投入。在机器人技术研究方面,波士顿动力一直走在世界前列,其打造了直立机器人Atlas、机器狗Spot、双轮单臂机器人Handle等在内的机器人家族,但苦于商业化失败而几经转手。

6月份,波士顿动力宣布旗下机器狗Spot引入新的视觉和音频功能,可代替人类从事危险工作,比如涉及辐射、高压等危险场景的工作;而随后机器狗Spot被安大略省电力公司采用,以此来代替人类执行拆卸600伏的高压断路器等危险操作。

spot-768x1024.jpg

当月,腾讯 Robotics X 机器人实验室也通过将前沿的预训练 AI 模型和强化学习技术应用到机器人控制领域,让腾讯机器狗 Max 的灵活性和自主决策能力得到大幅提升。目前,机器狗可以分阶段进行学习,有效的将不同阶段的技能、知识积累并存储下来,让机器狗在解决新的复杂任务时,不必重新学习,而是可以复用已经学会的姿态、环境感知、策略规划多个层面的知识。

Tencent-Max.jpeg

7月29日,谷歌旗下的DeepMind发布了一款单臂机器人模型Robotic Transformer 2(RT-2),被称为是机器人版的GPT,其不仅能理解人类提出的要求,还能进行简单的推理,最终完成指定任务。

近日,在2023世界机器人大会现场,来自追觅科技的一款人形机器人现场制作咖啡并成功“拉花”,使得追觅通用人形机器人成为全球首个成功实现咖啡“拉花的人形机器人。追觅科技人形机器人负责人喻超表示:“基于深度学习训练的视觉模型,追觅通用人形机器人能够在不同环境下都能准确识别不同材质尺寸的杯具及工具从而完成拉花。这是通用人形机器人走出实验室,探索实际应用的重要一步。”

dreame.jpg

早在2021年8月19日,马斯克在特斯拉人工智能日时就提出要推出一款人形机器人,旨在解决从事重复性高、单调枯燥的危险工作。一年后,马斯克在2022特斯拉人工智能日上公布了该公司的第一个人形机器人原型“擎天柱”。舞台上的机器人以缓慢的速度挥手,能做简单的舞蹈动作。马斯克指出,AI域是人形机器人的核心,因为机器人只有通过不断的机器学习的训练,才能完成指定的任务。

Optimus.png

小结

新世纪的前夜已经来临,但是目前来看,具身智能机器人的商业化落地还存在着大量问题。丰满的理想化前景催人奋进时,波士顿动力首席技术官Aaron Saunders在一次采访中的所言发人深省:

“我认为我们应当平衡对机器人的任务要求和期望值。人们想要一个执行新任务的机器人,如果机器人一旦出现失败,他们就会非常紧张。如果我们希望机器人能不断执行新的任务,不断迭代,丰富我们的生活,成为我们的工具,我们就需要依靠时间来不断训练它的能力。因为这是新兴技术,而不是既定技术。”


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK