人工智能的尽头,是“具身智能”?
黄仁勋、比尔·盖茨相继押注,这个新概念不简单。
未来的AI会是什么样?
在知名科技富豪比尔·盖茨的设想里:AI将成为人类的数字助理,它不会取代人类的工作,反倒是取代谷歌、亚马逊这类“老旧”的互联网平台。
巧的是,就在本周,微软联手OpenAI在一年一度的开发者大会Build上,抛出了类似的产品——Copilot、Bing和ChatGPT等一系列产品被集成到Windows上,打造出一个无所不能的“AI助手”。
比尔·盖茨把这种AI个人助理看成一种不同于ChatGPT的新物种,而微软CEO纳德拉也将其称之为一次变革。
那么所谓的“AI个人助理”究竟是不是下一个科技风口?它又有何底气能取代谷歌、亚马逊?
AI私人管家,盖茨的科技畅想
面对AI浪潮,你是对它的强大能力充满期待?还是对它会随时取代你产生惶恐?
在见识了AI的威力后,一度有上千名科技人士发表公开联名信,要求暂停大型AI技术的开发至少六个月的时间,并希望在此期间由顶尖专家与政策制定者合作,制定出有关AI的治理规范。
但显然各大巨头厂商并不情愿在这场AI竞赛中停下脚步,唯一能做的只是尽可能避免AI干坏事。
那么AI真的发展到威胁人类的阶段吗?
在比尔·盖茨看来,AI是一项“改变游戏规则的技术”,但这项技术仍然“处于早期,颇具革命性”。
而他所提到的革命性阶段,正是在本周AI Forward 2023活动上重点介绍的“AI个人助理”。
比尔盖茨在大会上预测到——
未来的AI个人助理将影响深远,能够了解一个人的需求和习惯,并帮助他们“阅读你没有时间阅读的内容”
这款强大的未来数字代理还需要一段时间的进化才能在主流社会中投入使用,在此之前,各大企业将继续在自己的产品中嵌入所谓的生成式AI,类似于OpenAI的ChatGPT。
未来公司使用的人形机器人会比人类员工更便宜,这也将对蓝领工人造成巨大影响。
如果看到这里还是无法理解“AI个人助理”的含义,那么可以参考下早已耳熟能详的特斯拉人形机器人,其最终目的几乎可以与人类助理划等号。
事实上在行业内,这类AI有它的专属名称——具身智能(Embodied Intelligence),它们是有身体并支持物理交互的智能体。
与之相对,ChatGPT则是“没有物理身体,只能被动接受人类数据”的非具身智能(Internet AI)。
也就在前不久的ITF World 2023半导体大会上,英伟达CEO黄仁勋高调表示AI下一个浪潮正是“具身智能”
在这场活动上,他公布了一套多模态具身智能系统——Nvidia VIMA,据介绍称,该系统能够在视觉文本提示的指导下执行复杂任务的全新AI模型,远比现有的大模型产品功能强大。
那么比尔盖茨口中的革命性阶段,是否可以理解为“AI+机器人”?
机器人,AI的最终解决方案?
早在1950年,图灵在他的知名论文《Computing Machinery and Intelligence》中探讨了人、机、智能三者关系。
这是一篇带有哲学意味的论证文,但图灵对于“学习机器”与“机器学习”的讨论,仍然值得当下AI行业深思。
例如,图灵认为机器可以“模仿”人的思维活动,但其所谓创造性能力,前提仍是“编程”,即机器可以模仿程序员的行为。
有分析机构指出,之所以机器人难以产生与人、与环境的交互,其主要障碍在于目前控制机器人的手段仍是手写代码。
而进入AIGC时代,AI大模型为机器人提供了新的解决方案,自动生成的代码可以帮助机器人实时解决现实世界出现的各类问题。
如今,已经有不少研究人员尝试将多模态的大语言模型接入机器人系统,从而帮助机器人实现推理任务。
在图片、声音、文字、视频等多模态输入下,大模型增强了对现实中对象的理解,让机器人也有了像人类一样的思考能力。
相比之下,ChatGPT这类非具身智能,由于无法产生与人类的交互能力,最终还是依赖人类已经采集好的数据,因此存在一定上限。
让我们回头再看看比尔盖茨的未来设想——
AI个人助理将能够理解用户的需求,并提供相关的信息和服务,这将使传统的搜索引擎变得多余。
AI个人助理将能够理解用户的购物需求,自动寻找最佳的产品和价格,并处理购物和付款的过程。
AI个人助理会自动安排会议,管理电子邮件,甚至帮助用户编写报告或演示文稿。
从上述描述来看,AI个人助理获取信息的来源都是源于真实的物理世界,这一点正与“具身智能”的定义十分吻合。
既然机器人可以不需要人类输入数据就能自我学习,那显然比ChatGPT这类生成式AI更具有“噱头”。
人形机器人,依旧遥远
在特斯拉2023年股东大会上,马斯克通过视频展示了Optimus人形机器人的最新进展,包括捡起物品、模仿人类动作,完成分类物品等等。
相比于初次登场时晃晃悠悠走了一圈就匆匆离场,这次Optimus可谓取得全方位进展,AI能力大幅提升。
相比之下,科技圈老熟人波士顿动力的人形机器人更是无所不能,空翻、跳跃样样精通。
既然人形机器人是“具身智能”最好的表现,那么是否预示着AI的下一个科技风口已经不远?
这里不得不泼一盆冷水,从中短期来看,人形机器人尚且难成风口,要实现“具身智能”则难度更大。
从人形机器人的角度看,市场需求并不像我们想象地庞大。
在工业领域,功能各异的专业机器人已经占据着大部分使用场景,人形机器人显得十分鸡肋。在服务领域,人形机器人并不如人们想象地智能,市场需求仍待进一步开发。
至于人形机器人的成本问题,尤其是三大核心零部件——减速器、伺服电机及控制器的成本,仍需等待产业链进一步发展。
而从AI发展的角度来看,科技巨头们真的愿意将巨额的AI训练成本投入放在机器人上吗?并非如此。
除了几家财大气粗的头部厂商以外,大部分厂商当下最重要的工作还是提升基础模型的能力,而ChatGPT等所谓的“非具身智能”更具商业价值。
更何况还有人形机器人还要涉及的伦理、AI觉醒等问题,远比ChatGPT这类“聊天机器人”要严重。
总的来说,“具身智能”这样的概念更像是一次炒作,离我们仍然十分遥远。
XR才是最终赢家?
虽然人形机器人还是过于超前,但是在AI时代,硬件厂商还是能够发挥各自优势,挖掘“智能助理”的价值。
例如,手机终端始终是个人助理最大载体,而随着未来AR/VR等技术的发展,头显设备将有较大机会实现软硬一体结合,例如曾经的音箱、耳机等硬件一样,成为“智能助理”未来的载体。
有分析师认为,OpenAI已经于3月宣布解除ChatGPT无法联网的限制,为ChatGPT添加对插件的支持,其目的就是为“智能助理”这样的超级应用做准备。
而近期微软尝试将Copilot接入集成到Windows,其目的也是希望AI可以重新定义其所有业务,并实现多平台运行。
AI的下一步,仍有无穷的可能性。
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新