登录

具身智能,“能”耐几何?

2025-03-21 13:33 来源:中国工业报

今年的《政府工作报告》当中出现了很多的新名词,其中,“具身智能”“智能机器人”这两个较为相近的表述引发了诸多关注。一时间,大家都在问究竟什么是具身智能?什么是智能机器人?它们又与近年来爆火的人形机器人有什么区别?

虽然听起来很前卫,但实际上具身智能并不是一个新概念。

1950年,人工智能之父、英国皇家学会院士艾伦·麦席森·图灵就提出了智能与物理形态相结合的设想,然而,受限于技术条件,它在很长一段时间里并没有取得实质性进展。直到近年来,随着人工智能大模型技术的突破,具身智能才真正迎来了发展的契机。

那么,热度暴涨的具身智能到底有多“能”?

具身智能到底是什么?

2024世界机器人大会上发布的《人形机器人十大趋势展望》指出,具身智能是可以在高变化下做出迅猛、精准反应的高质量、高性能智能系统。它既不是单纯的虚拟环境下的计算机仿真,也不是完全偏于物理空间的机电系统,与人形机器人系统紧密相关。

“具身智能应该是人工智能的一个分支,它主要是基于物理实体,能够与物理世界进行感知和交互,以及有行动的一种智能系统。”国地共建具身智能机器人创新中心总经理熊友军在中国电子学会组织召开的“贯彻落实全国两会精神——推动具身智能和人形机器人创新发展座谈会”上表示。简言之,具身智能就是让人工智能“拥有身体”。

熊友军进一步解释道,一方面,具身智能强调物理实体;另一方面,具身智能强调与物理世界能够进行交互、感知,同时与物理世界发生一些行为。

“我觉得要构成一个完整的闭环,构成智能体跟物理世界有感知,有决策、思考和行动的闭环。”熊友军认为,具身智能区别于离身智能和现在的普通智能。“现在的DeepSeek或者ChatGPT,这样的智能就是离身智能,可能存在虚拟空间、数字空间、信息空间;而具身智能,一定要有物理的实体。现在的智能可能是‘动嘴皮子’,而具身智能真的是要实干的,是一个‘实干家’。”

对于智能机器人,熊友军认为,其应该是具身智能的一种形式,它有物理的身体,能够与物理世界构成感知、交互和思考行动的能力同时,智能机器人又区别于传统的一些智能化的设备。“有些智能化设备没有传感器,完全靠程序驱动,环境变了,也不会根据环境的变化做出相应的响应,很少有思考和决策的过程,只是机械的执行,缺少跟物理世界交互、感知和思考的过程。像一般的智能化设备,可能还不属于具身智能,而智能机器人应该是具身智能里面的一种形式。”熊友军解释道。

“人形机器人,除了长得像人,应该还有功能和思考行为,模拟人的一种机器人。在学术里面,我们觉得,它是具身智能的一种表现形式,也被称为具身智能体的最佳载体。”熊友军表示,具身智能有很多种表现形式。如轮式的,轮带式的,复合型的机器人,机械臂类型的智能机器人也是具身智能的一种表现形式。因此,人形机器人只是智能机器人其中的一种而已。

针对具身智能、智能机器人与人形机器人三者之间的关系,全国政协常委、致公党中央副主席、全国妇联副主席、中国电子学会理事长徐晓兰进一步指出,具身智能是未来产业的重要方向;智能机器人是具身智能的典型终端产品,涵盖工业机器人、医疗机器人、服务机器人、农业机器人以及人形机器人等;人形机器人是智能机器人的高阶形态,也是具身智能的最佳载体。人形机器人可广泛应用于生产制造、仓储物流、抢险救灾、边防安防、商业服务、家政医疗等场景,将有力带动产业链上下游蓬勃发展,对推动科技创新与产业创新深度融合,培育瞪羚企业、独角兽企业,抢占全球科技与产业发展制高点具有重要战略意义。同时,人形机器人可在研发、生产、检测、维修、保养等环节提供大量就业岗位,是拉动新消费、催生新产业、扩大新就业的强劲动能,是应对社会老龄化的重要抓手。

人工智能的最终形态吗?

具身智能作为人工智能的一个分支,在其发展过程中,伴随着“具身智能是人工智能最终形态”的一种说法。

对此,行业内看法不尽相同。

知名数字经济学者、工信部信息通信经济专家委员会委员盘和林在接受中国工业报记者采访时表示,“结合智能体的具身智能可能是AI的终极形态,具身智能能过对环境进行感知,并基于感知独立决策,给出解决方案然后执行。这样的人工智能基本上模仿人类所有的动作,完成人类所有的工作。”

“具身智能强调智能行为与身体紧密关联,身体是智能的载体,智能是身体的延伸,使得智能与身体高度统一,从而达到具有全面适应性、连续性、协作性等特点。这也是实现通用人工智能的重要路径之一。”资深产业经济观察家梁振鹏在接受中国工业报记者采访时也认为。

然而,在接受中国工业报记者采访时,天使投资人、资深人工智能专家郭涛却表达不同的看法。他认为,具身智能是实现通用人工智能的重要路径之一,但它并非终极形态。AI的发展是一个不断演进的过程,未来还可能出现新的技术和理念,具身智能只是在当前阶段具有重要意义和发展潜力的一种形式。

科技商业博主、一篇网络主编赵宏民在接受中国工业报记者采访也不认同“具身智能是AI的终极形态”的说法。“因为人工智能还有许多其他的技术和概念也在不断发展中,如量子计算、隐私计算等。”

行业内对具身智能与人工智能关系的不同看法,也映射出人们对人工智能正在不断刷新认知。

近年来,似乎每过一段时间,“人工智能”的有关消息总能霸榜各类平台的热榜。郭涛认为,这是因为一方面,随着科技的不断发展和社会需求的变化,人们对人工智能的期望和要求不断提高,促使研究者不断探索新的方法和途径;另一方面,不同时期对人工智能的研究重点和应用场景有所不同,一些新的概念和技术在特定历史阶段可能因条件限制而未得到充分发展,随着技术的进步和环境的变化,这些概念又重新受到关注和应用。

盘和林则认为,“如具身智能中的一部分,已经从实验室开始步入实践应用场景,而具身智能一旦进入场景,他们学习人类的渠道就变多了,那么其发展速度会更快。人类社会也就真正进入了智能时代,而所有人都在期待或者担忧这个智能时代的到来,所以,具身智能每一步向前如今都能引发大量关注。”

值得注意的是,盘和林表示,“大部分具身智能产品还在探索阶段,我们不能保证说未来十年或者二十年会有大突破。当前,大多数具身智能的应用场景中都有替代品。比如,跨台阶是具身智能的一个功能,但如果是爬山,其实很多地方有索道,索道比具身智能运力更大也更经济,同样的,工业车间中,工业机器人也是具身智能的竞争对手。更多开放场景,由于具身智能成本过高,甚至不如雇人来得经济。所以,具身智能最大的挑战是商业化,而商业化最大的挑战是成本。”

“开源”影响几何?

3月19日,国家地方共建具身智能机器人创新中心预告,即将发布里程碑式的通用具身智能平台——“格物”。值得关注,一周前,3月12日,北京人形机器人创新中心(国家地方共建具身智能机器人创新中心)才刚刚发布了全球首个“一脑多能”“一脑多机”的通用具身智能平台“慧思开物”。记者在发布会现场了解到,这一平台将为人形机器人配备“大脑”和“小脑”,能够实现从任务理解到执行的全流程智能化,填补了具身智能领域在通用软件系统方面的空白。

“自去年11月,我们启动了开源计划以来,在本体开源方面,很多的合作伙伴,基于天工硬件母平台,在他们的应用场景里面做深度的垂直领域的二次开放,如优必选用天工平台开发了‘天工行者’,用于科研和教育。”熊友军介绍,另外,在数据集的开源方面,国家地方共建具身智能机器人创新中心发布了首个行业标准化的通用具身智能数据集,并首批开放了10万条的数据。同时,在开源社区方面,通过开源协作的模式,吸引了几千名开发者参与模型训练的工作。

而更早些,1月21日,由国家地方共建人形机器人创新中心牵头的全国首个异构人形机器人训练场正式启用。据国地共建人形机器人创新中心总经理许彬介绍,这个具身智能训练场的核心目的是解决具身智能产业发展中的模型训练的技术问题,进一步强化我国人形机器人研发和应用的基础支撑,重点针对数据采集效率低、成本高、数据无法跨平台复用以及缺乏统一的数据标准规范等挑战。异构人形机器人训练场将重点围绕四个方向进行建设:一是构建可重构场景和训练的基础的具身智能模型;二是打造异构集群采训推开源框架;三是搭建具身智能操作与任务调度系统;四是建设开源共享和共性机制,形成模型数据飞轮。

作为“国家队”,在发展过程中,两大创新中心均不约而同瞄准了“开源”。

在北京市社会科学院副研究员王鹏看来,大模型开源或打造开源开发平台能重点解决一些技术问题。一是算法成熟度。开源大模型可以提供经过验证的算法和模型,降低人形机器人研发中的算法开发难度和风险。二是数据获取与处理。开源平台可以共享数据资源和处理工具,帮助研发者更高效地获取和处理数据,提高人形机器人的感知和认知能力。三是软硬件解耦。开源开发平台可以促进软硬件的解耦,使得研发者可以更灵活地选择和组合硬件和软件组件,降低研发成本和提高研发效率。

“开源大模型可以应用于人形机器人的智能感知和交互系统,提高其环境感知、语音识别、自然语言处理等能力。开源平台提供的算法和模型可以应用于人形机器人的决策和规划系统,帮助其实现自主导航、路径规划、任务执行等功能。此外,开源大模型还可以支持人形机器人的持续学习和进化,使其能够适应不断变化的环境和任务需求。”王鹏对记者表示道。

“从目前人形机器人研发角度看,开源或打造开源开发平台是解决技术问题的有效途径之一。”梁振鹏则认为,开源平台可以帮助开发者快速获取最新的技术成果和工具,缩短研发周期,降低研发成本。同时,开源平台也可以促进开发者之间的交流和合作,共同推动人形机器人技术的发展。通过开源平台,开发者可以更容易地实现人形机器人的智能化和自主化,从而降低人形机器人研发的成本,并促进其商业化应用的发展。

郭涛表示,开源平台可以提供更强大的语言理解和生成能力,帮助人形机器人更好地理解人类指令和进行自然语言交互;还可以为人形机器人的知识学习和推理提供支持,使其能够更快地获取和运用知识。

盘和林则认为,大模型开源开发平台,在具身智能领域,其实是做一个生态。“你用具身智能搬运,我用具身智能生产,他用具身智能洗碗,中国制造业发达,相关机器人的硬件好找,但软件开发,算法需要长期投入,而开源平台降低了算法开拓成本。反过来,当你的生产,搬运,洗碗具身智能已经成功应用,那么,你为开源平台做了共享,这些功能方案会整合回平台当中。未来,我们可能收获一个既会生产,也会搬运,还会洗碗的机器人。所以,好处在于,一方面节约具身智能部署成本,另一方面逐渐形成具身智能的生态。”

未来向何处发力?

“现在人形机器人这么火,有一个问题可能会给大家泼一盆冷水。”赵宏民在接受采访时反问记者:“你猜,现在最先进的人形机器人,充满电,能不间断运行多长时间电池耗尽?”

“答案很可怕,根据不同产品不同运行强度,大概续航时长是30分钟到2小时。从这个意义而言,除了一些临时表演和一些紧急的救援任务。脱离了电线的那些人形机器人,应该还不具备大规模商业化的可能。”赵宏民表示。

具身智能除了商业化的问题外,熊友军认为,具身智能领域还存在三类主要问题:

一是关于数据集,当前,各单位虽逐步开源数据集并建立收集平台,但存在规模小、任务单一问题,导致机器人智能体训练效率低、成本高。熊友军建议,各创新中心打通数据壁垒,推动全国协作共享,构建规模化训练资源体系。

二是关于应用场景。我国具身智能产业起步较晚,熊友军希望,工信部牵头鼓励企业试用并开放场景做测试。我们虽搭建了一些场景,但与真实场景有差距。具身智能在实验室训练后,还需在真实场景试练,目前,国家地方共建具身智能机器人创新中心在高压、冷库等危险场景做了测试,但与真实场景区别还比较大。

三是关于产业链。目前产业链还是没有成体系,有一些上游产业链,核心关键的产业链,感觉有一些简单的重复,造成资源浪费。而核心的产业链,做的人却比较少。

“具身智能和人形机器人是将人工智能转换为现实生产力的重要载体,是培育发展新质生产力的重要方向。”工信部科技司副司长杜广达表示,下一步,工信部将深入贯彻落实党中央、国务院决策部署,按照“一端抓供给,一端抓应用,整体壮生态”思路:一是继续推动具身大模型、工具链等技术攻关突破。二是持续挖掘人形机器人高价值应用场景,促进供需对接。三是做强做优产业生态,加快推出一批关键急需标准,建设开源社区,打造整机、数据集等开源项目,提升安全可靠性测试能力和伦理治理水平,加强行业自律。

据麦肯锡预测,到2030年,全球具身智能市场规模可能达到数十万亿元。具身智能不仅蕴含着巨大经济价值,更关乎国家竞争力。如今,具身智能被写入《政府工作报告》,更是标志着它正式成为国家未来产业的重点发展方向。

可以预见,一个更加智能化的未来,正加速向我们走来。

相关新闻

编辑精选