当智能手机用上“AI系统”,AI Pin拿什么赢?
如何做AI手机,现在有了一条新思路。
它没有屏幕,全靠声音与投影进行交互,用户只需简单几句,这个“小方块”就可以作出回应。
除了官方描述得无比科幻以外,行业也是对这款硬件无比看好。
首先该产品被《时代》评选为“2023 年年度发明”,一度被视作颠覆iPhone的革命性产品。其次作为研发公司,Humane拿到了OpenAI、微软、高通等科技巨头数亿元的注资。
但随着近期AI Pin开始发货,媒体评测随之解禁,网友们这才发现,实机展现的效果可谓令人大跌眼镜。
除了AI Pin以外,Rabbit R1等AI硬件也在CES大会上赚足了眼神。但这些AI硬件想法很好,可短时间内很难摆脱不了“智商税”的标签。
“iPhone杀手”口碑翻车,哪里出了错?
AI Pin的体验究竟有多糟糕:系统操作复杂、三分钟过热关机、在阳光下几乎无法使用投影……
除了这些最直观的负面体验感以外,AI功能响应慢且回复内容质量低、系统功能需额外付费、佩戴方式对衣服材质有要求等等,这些问题放在任何一个成熟的硬件上都是槽点。
更糟糕的是,AIPin有超过450万台的预定量,而价格又不便宜(699美元,约合人民币5000元)。
这就意味着这一批用户都成了高价购买智商税的“怨种”,也难怪网络上一边倒的负面评价。
对此,Humane高管急忙回应外媒The Verge称,公司会在下个软件版本中提高不间断运行时间,并提高整体热性能。
但从目前已有的信息来看,AIPin这些问题其实基本来自硬件条件。
在去掉了实体屏幕后,AI Pin的体积并不大,但官方还是在这款硬件里塞入了摄像头、全息投影、可以支持AI功能的处理芯片以及满足续航的电池。
不过过小的体积,也意味着这款硬件的硬件性能并不会太高,更不要说与智能手机芯片相提并论的。
既然如此,又想让AIPin跑得动ChatGPT,又要兼顾续航、拍照像素、相应速度等各个方面,自然是不可能的。
有媒体评价说,以目前的回应效率来看,用户使用智能手机获得准确答案的速度,要远快于AIPin。而智能手机还只是使用传统的搜索引擎。
如此来看,AI硬件虽然宣称利用AI Agent的能力挑战智能手机的霸权,但自身的硬件能力还是限制了发挥。
当智能手机玩起了交互
就在硅谷推动AI硬件的同时,手机制造商、芯片厂商们都在思考如何让手机用上AI。
有些厂商选择把大模型塞进手机里,主打“端侧大模型”,通过直接读取手机上的数据的方式,运行AI功能或app。
而有些厂商选择从云端调用AI能力,减小本地存储的压力。
无论选择本地还是云端,这些所谓的“AI手机”,本质上仍是“用上了语言大模型Large language model(LLM)”的手机,手机的硬件只是一种载体,完全依赖API 接口。
一旦背后使用的LLM大模型不给力,那么用户也很难体会到AI的真正实力。
而AIPin和Rabbit R1这样的AI硬件,它们主打的是用户与AI的交互能力,后者团队更是提出了一个大型动作模型(Large ActionModel,LAM)的概念,通过理解人类如何使用应用和服务,从而完成模仿操作。
这就意味着,即使界面有所不同或稍有变化,LAM也能适应并准确地执行任务,最终用户可以仅靠一个界面,代替所有的App。
想法虽好,但Rabbit R1犯了一个和AIPin同样的错误——硬件配置水平实在是过于入门(2.3GHz联发科P35芯片、4GB内存、128GB存储空间),用户本意上冲着更智能的GPT而来,结果往口袋里多塞一个硬件。
相比之下,智能手机不仅配置吊打这些AI硬件,而且能实现。接下来,就是看手机厂商们何时能搞出这种类似于LAM的“自适应系统”。
也就是在上周,苹果发布了一篇最新的论文,推出了一个叫Ferret UI的新模型。该模型的核心正是通过读取屏幕信息的方式,为用户提供高质量的UI理解和交互。
据报道称,FerretUI的前身是一个名为Ferret的多模态模型,用于改善与语音助手交互逻辑。
在去年十月刚刚发布时,Ferret的业界对其反响并不热烈,主要原因还是它的区域识别与主流大模型卷的方向不同,因此大部分人都认为Ferret并没太强的能力。
到了Ferret UI上,苹果弱化了对话、推断等大模型常见的能力,而是将重点放在了处理复杂的UI交互以及理解并响应用户的指令。
那么停留交互层面上的Ferret UI,或许能力是有限的,但若是配上网传的谷歌Gemini模型,那将达到“1+1>2”的效果。
从这一点看来,Ferret UI和Rabbit R1的思路非常相似,但显然iPhone的玩法更多、性能更强。
如果一部手机能解决AI交互,那还要AI硬件什么事呢?
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新