◎杭州宇树科技有限公司创始人兼CEO王兴兴在接受《每日经济新闻》采访时表示,人形机器人在工业领域的应用正处于试点阶段,如蔚来的汽车工厂已部署人形机器人进行现场搬运。尽管目前尚未形成商业闭环,但前景广阔。当前行业面临的最大瓶颈是AI技术尚未达到突破性水平,导致机器人效率低于人类,难以实现大规模商业化。然而,随着大语言模型和其他AI技术的进步,预计三到五年内将出现具有商业经济价值的终端产品。王兴兴强调,中小公司在这一领域的优点是灵活性和对前沿技术的敏感性,能够在快速变化的市场中占据一席之地。
在电影《星球大战》中,从劳动到生活陪伴,人形机器人在各领域扮演着关键角色。近两年,随着新一代人工智能出世,以及长期资金市场加强对未来产业的投入,人形机器人开始逐渐从科幻走向现实。
从资本市场近期表现看,人形机器人概念持续火热,部分公司涨停连板。花旗全球洞察分析师指出,预计未来25年,人形机器人市场规模将达到惊人的7万亿美元。
与此同时,人形机器人部分产品也已开始出售交付,大有批量“进厂打工”趋势。如2024年5月,特斯拉研发的二代Optimus人形机器人已进厂实训,计划2025年年底前量产销售。在国内,如宇树科技、达闼科技等厂商也均已布局。
除了工业领域,人形机器人离我们的生活还有多遥远,何时能“飞入寻常百姓家”?当前行业发展难点又有哪些?
近日,杭州宇树科技有限公司创始人兼CEO王兴兴接受了《每日经济新闻》记者(以下简称NBD)采访。
NBD:去年国内很多人形机器人“进厂打工”,您怎么看这个现象?宇树人形机器人的落地现状和未来规划是怎样的?
王兴兴:我觉得这是一个趋势。我们过去几个月与蔚来的汽车工厂有合作,就现场部署了人形机器人做现场搬运。这样的领域目前基本处于试点阶段,大家认为这个方向有价值,就共同推进落地部署,不过目前还没有到真正的商业闭环阶段。
我们企业主要是卖本体,如果是做科研教育、AI公司或者个人买来玩,我们完全欢迎。
但工业领域也在推进,比如我们大家都希望去工厂帮忙做一些简单的生产装配,或者一些简单的搬运工作,蔚来汽车工厂就是典型例子。我们实际上没有给自己定目标或者逼迫那么紧,还是尊重整个市场的反应,等技术、产品和大家接触到某些特定的程度了,已经有一些更好的商业势头了,我们再大规模去推广。
NBD:在人形机器人技术快速地发展的当下,面临的最大瓶颈是什么?目前人形机器人应用领域中,哪几个方面有可能实现突破性进展?
王兴兴:当下的最大瓶颈,包括人形机器人、四足机器人等,是基层AI在全世界内都未达到一个像初代GPT或者初代通用AI的能力,这也是目前整个行业最大的问题。
目前机器人本身,比如双臂机器人或者工业机器人,如果加了AI以后产生的能效比人低,如速度比较慢、精度比较差、能干的活比较少,其实很难替代人在工业领域的价值,整个商业闭环没法跑通。
如果机器人AI的能力能突破一个临界点,工厂基本工序能跑起来了,而且效率比较高,价格也比较便宜,能轻松实现商业闭环并大规模推广,我觉得是最有价值的。
当然,目前硬件方面也有些挑战,比如硬件的机械臂负载能力不够,精度不太够,成本有点高,但这只是工程上的问题。
所以,最大的问题还是整个机器人AI没有突破一个临界点,目前在具身智能或者机器人AI这样的领域,当下大家还觉得机器人有点笨拙,只能干一些固定的活,但我个人比较乐观。再过三四年,不会超过五年,比如在工业或服务业,能有终端产品出现。
NBD:近期人形机器人火热至极,但公司早期也不看好人形机器人,请问宇树是怎样调整发展的策略的?
王兴兴:2020年以前就有很多投资人问我,你们做不做人形机器人,我非常斩钉截铁地说不做,但为什么我们2023年初又开始做人形机器人了?
其实最早在2009年和2010年,我自己做过小的仿生人形机器人,当时远未达到我的预期,最大原因是当时全球人形机器人的控制技术不是特别理想,性能上不去,没办法看到实用价值,当时我就坚持不做人形机器人。
但到了2021年、2022年,全球科学技术对人形机器人很关注,并且在2022年底大语言模型出来以后,AI技术产生了质变,已经看到AI赋能机器人带来的潜力。大家可能想象不到,2022年底,我们还没做人形机器人,但已经有一些客户找上我们想买人形机器人。我觉得社会的共识、热度,客户对它的期待程度,已经足够了,所以我们2023年开始正式做人形机器人。
我们一直希望公司的商业化是相对来说还是比较正向和积极的,本身产品是有人愿意采购、社会对它有认可度的。当年选择做四足机器人,是因为行业已经有些苗头了,现在选择做人形机器人也是基于这样的情况。
NBD:从目前人形机器人的研发来看,大模型可重点解决哪些技术问题?主要使用在在哪些方向?大模型和人工智能的应用有望降低研发成本吗?
王兴兴:目前大家说大模型,一般在说大语言模型或者多模态模型,实际上这部分是可以给机器人用的,2023年我们就结合了OpenAI的大语言模型接口,但实际上大语言模型本身是机器人模型的一部分,并不是全部。
比如跟机器人沟通的时候,肯定需要语言部分,但实际上我个人觉得机器人的AI模型,本质上和语言模型还是有很大区别。举个最直观的例子,在工厂里做事的机器人,可完全不说话,我给它一个任务,它只要能干活就行了,我并不是特别需要让它说话。
机器人具身智能的核心在于其执行任务的能力,而不单单是对话。手机已能完成简单的对话任务,因此机器人需要更高级的功能。但这部分训练其实跟大语音模型没多大关系,更多依赖于模仿学习,而且这个模型结构跟大语言模型结构也偏差比较大。这是目前大家已经看到的方向了,但是整个体系没有大语言模型那么成熟。
在机器人具身智能领域,每家公司的想法都不太一样,技术路线和共性都不太一样,这就导致了其实很难评价发展路径是正确还是错误。
举个最简单的例子,在大语言模型圈,ChatGPT模型出来以前,就有非常多语言模型结构,但大家现在已经忘了,因为发现GPT模型的架构更有价值的。现在人形机器人具生智能有点像ChatGPT出来的前一两年,大家已经发现了这个方向,要往这个方向做,但还没有哪家敢说自己的方向绝对正确。
NBD:随着AI技术慢慢的提升,对未来机器人高效辅助人类工作方面,您有什么期待?
王兴兴:“干活”是分好几个阶段的,目前AI模仿学习,做一些固定工序的事情,已经完全可行。前段时间特斯拉展示过,在某个时间将一件东西拿到这里,这个技术很多公司都能做,还能够接近100%成功率。如果换件事,就要有新的数据去做新的训练,但这类事情已经能做简单的商业化了。
更进一步的话,还是希望机器人能在工厂里做更复杂的事情。比如把零部件更好地装在一起或拆了,现在都不在话下,而要做更复杂的事情,我觉得可能要到明年后年了。
更往前一步,就希望机器人能通用,随便找一个机器人,我只要给它看一张照片,就可以把产品装起来;或者把一个机器人带到你家里,不知道你家原本啥样子,就知道洗衣做饭,把房间整理好。
NBD:当前互联网大公司、巨头等都在加速进军机器人领域,您觉得中小公司的机会在哪?贵公司商业化进展预期如何?
王兴兴:我们企业成立至今已有8年时间,早期对于未来趋势和方向还没那么清晰的认识,但经过几年的发展,尤其是与国内外多家大公司接触后,我逐渐意识到,对于中小公司来说,保持对前沿技术的敏感性、预见未来并保持灵活性是至关重要的。若能够预测未来1-5年的技术发展、产品形态和市场格局,并提前准备好,那么公司至少能够稳定发展。虽然不能够确保成为行业第一,但能在早期阶段有一席之地。
相比之下,大公司由于内部流程复杂,资源和沟通可能不够顺畅,有时候甚至在招聘方面也不如中小公司灵活,这限制了他们的快速发展。
对于商业化,我们公司一直很看重,并不断探索合适的商业模式。公司2016年成立,我们在2017年开始接受四足机器人的预订订单,2018年开始正式发货,这表明我们从始至终将商业化放在重要位置。无论是四足机器人,还是人形机器人,我们都是以市场需求为导向进行研发的。
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。
如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。
特别提醒:如果个人会使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。
对话宇树科技创始人王兴兴:人形机器人距离达到“iPhone时刻”还需时日,新入行者应保持克制
宇树“觉醒”,云深处“出海”:四足机器人批量化应用有望步入“iPhone”时刻|2024年末出海观察
火到国外,马斯克也忍不住转发!空翻、倒立旋转、复杂地形穿越……国产机器人高难度动作看呆观众,厂家订单已遍及全球
欧盟科学院院士、日本工程院院士任福继:未来社会是自然人、机器人、数字人“共舞”的时代
胖东来2024年销售额近170亿元,茶叶卖了6亿元,珠宝卖了15亿元!
中国地震台网正式测定:宁夏银川市金凤区发生4.6级地震,震源深度10千米
突发!阿里巴巴出手,套现120亿元!年收入725亿元的子公司被卖掉,业内:本次交易没有输家
1月2日上证指数收盘下跌2.66%,创业板指下跌3.79%,深证成指下跌3.14%
美国汽车冲撞人群事件死亡人数升至15人,拜登发声;“涨”声一片!新能源车企晒成绩单;这家银行股权,1元起拍;120亿元!阿里清仓丨财经早参
刚刚,银川又震了,4.6级!当地震感强烈,工作人员:银川进入地震窗口期