初创团队要让机器人走进百姓家

发布时间:2024-09-18 20:06:33 来源: sp20240918

原标题:初创团队要让机器人走进百姓家

  

  今年爆火的人形机器人,“火”到服贸会上了。在2024年服贸会国家会议中心综合展区,一家无人值守药店吸引了不少观众驻足围观。北京青年报记者在现场看到,药店“接单”后,找药、抓药、递送等环节,均由一台一人来高的人形机器人完成,科技感十足。在这台机器人的背后,凝聚着北京银河通用机器人有限公司打破陈规、弯道超车的大胆尝试。站在人工智能风口上,这个年轻的初创团队让机器人拥抱大模型,使其拥有更智慧的“大脑”、更灵活的“小脑”。而他们的终极梦想,是让机器人走进千家万户,把人们从繁重的家务劳动中解放出来,享受更加美好的生活。

  紧抓机遇再创业 让机器人拥抱大模型

  对计算机和人工智能颇感兴趣的连续创业者朱辉,早在十年前便已涉足机器人产业。不过那时人工智能大模型尚未出现,企业制造出来的机器人也显得不够聪明,“说是智能机器人,我倒觉得更像‘智障’机器人。”朱辉笑称。

  尽管如此,十年来朱辉仍在持续关注智能机器人产业。2021年国外一家公司发布通用机器人计划,随后推出首款人形机器人“擎天柱”,标志着人形机器人进入加速产业化阶段。2022年年底,以ChatGPT为代表的大语言模型在全球范围内受到广泛关注,人工智能领域实现了一次重要突破。此时朱辉敏锐地意识到,智能机器人的黄金机遇期来了。

  朱辉与银河通用创始团队早有接触。得知他们正在筹备组建新公司时,朱辉义无反顾地加入了这个平均年龄不到30岁的年轻初创团队,再次投身他所热爱的“智能机器人”赛道。

  提起团队成员,朱辉赞不绝口:“公司创始人之一王鹤本科毕业于清华大学电子系,后来到斯坦福大学读了博士,他是国内具身智能领域的领军人物,也是国际顶尖学者。另一位创始人姚腾洲在机器人行业也有多年实战经验,曾负责多个系列机器人产品的研发工作,积累了丰富的经验。他们在专业技能与产品研发、商业化等方面形成优势互补。”

  技术“大牛”们描述的智能机器人,更是让朱辉充满期待:“他们希望做一款通用人形机器人。一方面表现在‘任务通用’,机器人在执行抓取、放置、开柜子、开抽屉、送货等不同任务时,能够做到‘言出法随’,人们让它做什么,它就能做什么;另一方面表现在‘环境通用’,机器人能在各种地形和环境当中自由穿梭,自动感知并适应周围环境。这是我十几年来一直期待的智能机器人应该有的样子,我相信我们有能力制造出这样的机器人。”

  打破陈规再创新 仿真数据训练机器人

  朱辉在银河通用的职务是产品总监。公司成立初期没有办公场地,他便整天泡在咖啡厅里工作。直到在中关村红极一时的电子产品大卖场——鼎好大厦完成升级改造,朱辉与团队成员才有了自己的“窝”。朱辉介绍,银河通用成立于2023年5月,当时正处在人工智能的风口上,公司乘势而为,依靠大模型,开始推动人形机器人加速“进化”。

  “当时摆在我们面前的第一道难题,就是如何让产品拥有‘泛化能力’。”朱辉介绍,传统机器人之所以不够智能,是因为它只能依靠程序员编写的代码指令完成规定动作,“以抓取桌面上的矿泉水为例,程序员要编写代码指令告诉机器人桌子的位置、高度,水瓶的颜色、形状等信息。只要其中任何一个指标发生变化,这段代码指令也就失效了。”

  相比之下,大模型可以突破限制,让机器人具备人的认知和推理能力。朱辉解释:“虽然杯子的形态、材质不同,抓杯动作和角度各异,但只要机器人学习得足够多,就能知道怎样做。通过海量数据训练,机器人就能具备通用性,也就是人们常说的‘泛化能力’。”

  理论有了,训练机器人所需的海量数据又难住了他们。仅靠真实世界的数据采集显然是“杯水车薪”。朱辉说,国外有一家机器人公司曾经使用十多台设备、花费一年多时间、耗资近两千万美元,采集真实世界的数据。但这种方式不仅成本高昂,且效率低下,最终机器人仅能在经过特定训练的场景里抓取物品。如果换一个空间,机器人的抓取成功率就会急剧下降。最后,朱辉的同事们通过“合成仿真”技术,帮助机器人跨越了虚拟到现实的鸿沟。

  “这项技术不需要真人戴上设备采集数据,而是依靠合成仿真数据来训练机器人。银河通用自研生成了千万级场景数据和十亿级的抓取数据。这些数据覆盖了家用电器、工具等物体的操作方式,以及不同材质、形态、摆放方式的物体。我们在这个虚拟世界里,训练了机器人多项泛化技能,包括物体抓取、开门开抽屉、晾衣服等。”朱辉说,通过大量的仿真数据训练,帮助机器人走进商超和家庭,将科幻小说中的情节变为现实或许已经不再遥远。

  密集参展亮实力 助力产品精准找市场

  经过近一年的技术研发与真机测试,今年夏天银河通用迎来了“交作业”的关键时刻——公司第一代人形机器人产品“盖博特(Galbot)”,开始在大型展会上密集亮相,展示实力、拓展市场。

  最令朱辉印象深刻的,是6月份的2024北京智源大会,那也是“盖博特”自落地以来的“首秀”。“参展前一天晚上我几乎没怎么睡,不是紧张,而是充满期待。我们将成为全球首家可以用真机长时间演示泛化操作能力的具身大模型机器人公司,这是多么令人心潮澎湃的事情!那会儿我的希望就是‘盖博特’受到市场认可,希望能有更多人了解银河通用。”

  人形机器人“盖博特”在北京智源大会上一炮而红,之后又陆续在两岸青年交流峰会、世界人工智能大会、世界机器人大会以及正在举行的服贸会上亮相。每到一处,都会引发大量关注,这也让银河通用团队越来越自信。他们珍惜每一次“秀肌肉”的机会,“盖博特”每次亮相也都会比前一次展现出更强大的能力。

  朱辉介绍,在北京智源大会上首次亮相时,“盖伯特”展现出泛化抓取能力,可以抓取桌面上随机摆放的纸张、饮水瓶、零食等物品,执行桌面清理任务;在世界机器人大会上,“盖伯特”展现了清理桌面、货架取货、货架补货、抱箱子等四项能力,适应的工作场景也更加丰富,“短短两个月时间里,我们的人形机器人产品在不断加速升级。每一次展示都能给观众带来新的惊喜,我觉得特别骄傲。”

  参展过程中,朱辉经常与不同领域的从业者进行交流,这让他对行业痛点和市场需求有了更为直观的了解。在一次展会现场,一名从事制造业的观众来到银河通用展台,观看机器人在应用场景中的工作状态。“他说工厂里面有大量枯燥重复的劳动等待机器人去替代,最典型的是‘线边取料’,物流人员将生产线所需的各种零部件、原材料配送到特定位置,随后生产线操作人员将这些物料搬到小车上,再运送至生产线进行生产。这项工作枯燥重复,但传统机器人又无法胜任,因为零件在料箱中是随机堆叠放置的。我告诉他,像‘盖博特’这样有泛化能力的机器人就可以完成这一任务,它能够感知周围环境,自主规划移动路径,在完全陌生的环境里完成工作。”

  展览现场,“盖博特”还吸引了不少小朋友的关注。孩子们会热情地把手中的玩具放到展台上,等待“盖博特”抓取,他们觉得这个过程很有趣。这样的景象也让朱辉感到欣慰:“人形机器人正处于萌芽期,未来还有很长的路要走。这些小朋友注定会成长为社会的中坚力量,如果我们的机器人在与孩子互动的过程中,能让他们觉得机器人好玩儿、有趣,从小接触前沿科技成果,在心里埋下一粒探索的种子,那也是我们的一项成就。说不准将来的某一天,他们就会投身到这个行业当中,和我们并肩作战,推动具身智能的发展进步。”

  现场

  机器人值守无人药店 自动完成订单配送

  昨日,北青报记者在国家会议中心综合展区看到,在一家无人值守药店内,货架上摆着近百种药品,一台一人来高的机器人正灵活移动。现场观众在平板电脑上选择药品并“下单”后,机器人便会按需求在货架上寻找药品。锁定目标后,机器人抬起右臂,“吸盘手”瞬间把药盒“吸”起来。转身、移动,机器人最终回到展台,把药品递给观众……整个过程科技感十足。

  北青报记者了解到,服贸会现场展示的这台人形机器人正是银河通用的第一代产品“盖博特”。银河通用机器人产品总监朱辉介绍说,这台人形机器人可以完成取药、补药、理货等一系列动作,是“硬件本体+小脑+大脑”的集大成者,并且展现出更聪慧的“大脑”,更灵活的“小脑”。

  “在多模态大模型技术赋能下,我们给人形机器人装上了‘大脑’,可以理解人类自然语言,并根据语言指令与人类交互。”朱辉介绍,当人们对机器人说“我渴了”的时候,机器人首先调动大脑大模型,理解这句话的含意。“‘我渴了’意味着‘想喝水’,然后观察周围环境,判断哪个物品是可以喝的,在多种物品中进行精准识别。找到合适的物品后,机器人调动‘小脑大模型’,完成移动、抓取等动作。”

  据介绍,在大小脑模型的联动下,“盖博特”已可以理解人类自然语言并根据语言指令与人类交互。朱辉透露,预计今年年底,人形机器人“盖博特”将应用到真实的药店等场景中,实现药店夜间场景的无人值守和药品订单的机器人取送。

  对话

  “我们的最终梦想是让机器人走进家庭”

  对话人:银河通用机器人产品总监朱辉

  北青报:今年人形机器人爆火,您如何看待这一现象?

  朱辉:目前全球最热的产业,非人形机器人莫属。随着大模型横空出世,人形机器人作为一个重要的关键词频繁出现在我国的重要产业规划蓝图中。人工智能赋能各行各业,推动产业创新与升级,正在引领第四次工业革命,全球寄予它开辟一个前所未有新世界的期待。当下,大模型加机械躯壳的人形机器人站在了前排,引发公众的高度关注。

  人形机器人是先进制造业的集大成者,其产业发展将会带动机械、电子、传感、软件、通信、人工智能等高端产业共同进步。智能控制的嵌入式计算方法、传感器技术的突破不仅能带动人形机器人产业的发展,还能给其他行业带来经济效益。随着人形机器人代替流水线上的工人,进入农业、建筑等领域,有业内专家估计,未来大约30%的工业场景将被重新定义,这将大大推动生产力跃升。

  北青报:制造一个人形机器人,需要哪些基本技能?

  朱辉:机器人一定要有胜任力,也就是说,它一定要在场景里干活儿。过去一年里,我们利用合成数据对机器人的三项基本技能——抓取、放置、导航进行逐一攻克,让机器人具备更强的学习能力、对复杂场景的感知与理解能力,学会“举一反三”,使机器人能够自主移动并执行拾取和放置任务。

  如今,我们正率先在零售场景里实现全场景的闭环,机器人进入场景后能自主探索货架,把货架上所有的商品完成建图识别,整个过程自动部署、自动取货、自动交给顾客。我们把这个场景做好,就实现了“从0到1”的突破。下一步我们还将朝着“从1到100”的目标迈进,辐射更多行业。

  北青报:机器人距离走进百姓日常生活还有多远?

  朱辉:永远不要对短期科技的爆炸产生过高的期待,但也不要忽略远期科技的成长将会带来的巨变。人形机器人在今天还处于萌芽期,在未来三到五年的时间内,人们可能会在一系列应用场景里看到它。

  人形机器人最终的目标是“通用”,取代我们现在只能做一件事情的专用机器人,实现多任务、柔性的操作。未来,打造出员工型机器人,真正对制造业和劳动力市场进行革命性的推动。我们预计,未来五年,银河通用的智能机器人将广泛应用在商超、车场等场景中,承担货物配送、线边取料等任务,用新质生产力为企业赋予新动能。

  在我看来,制造人形机器人的最终梦想是应用于家庭,帮助人们拿水、晾衣等,解放家务劳动。家庭场景的复杂程度更高,目前,执行这些任务所需的各项技能正在训练当中。预计未来五到十年,机器人将有望真正走进百姓家庭。

  本版文/本报记者 王斌 摄影/本报记者 袁艺

(责编:孙红丽、李楠桦)