星空体育官网:
当机器人能在未见过的环境中,凭自然语言指令达成目标时,就是机器人的ChatGPT时刻。
如果想要机器人能做到这些,一个最重要的问题是对物理环境、自然语言指令的实时理解和处理,这就对于端侧AI的通信能力有更高要求。
目前我觉得包括很多机器人厂商或者芯片厂商,都有点点忽视芯片对于机器人的重要程度。
就像新能源汽车一样,最近十几年最大的变化是随着新通信协议出现,线缆数量减少了很多。早年间一辆油车的线缆数量是非常夸张的,可能一辆车里线公斤。
我相信未来机器人的终极想象是每一个手臂上就只有一根线缆,别的都没有了,多干净整洁,想要实现这个目标还有非常多工作要做,但这很值得做。
机器人本身的空间就那么大,很多时候高算力的芯片都装不进去;同时电池容量、散热,对于这么大的机器人来说都是很难解决的问题。
太大是不行的。我觉得手机芯片等类似芯片用到机器人身上是非常有想象空间的。
目前处在黎明前的前夜,前夜反而是挺麻烦的。最大的问题是行业内各家技术路线差别很大,都有各自的想法,这就会导致这样的领域非常热闹,但整体进展没那么快。
王兴兴说,这个模型真正放在工厂或者生活中是不能直接用的,那不如开源出来。这有一点像OpenAI早年间的时候,因为大模型的商业经济价值或者说距离落地还有点远,GPT-1、GPT-2都是开源的。
至于现在大家总是讨论的VLA模型和世界模型之间的问题,说实在的很难讲得很清楚,因为哪怕就是VLA模型、世界模型本身也都有非常多变种。我们公司会保持开放的态度,尝试各种模型,包括自己开发以及和第三方合作等。
我个人觉得在AI领域要保持谦卑的态度,永远有更聪明、更开放的人做更好的东西出来,我们保持谦卑的态度去学习。
我们的目标是让机器人真正在家庭和工厂里用起来。我认为无论是芯片、通信协议、算力、通信架构、甚至是整个无线通信架构可能都需要一些调整。
当下这样的领域确实太新了,我们每时每刻都会面临一些新的挑战和问题,这不是单个公司能解决的。我们也希望更多人参与进来处理问题,比如我们一般用的Linux系统本身还有很多漏洞,我们在开发时需要把底层漏洞完全解决,这是比较花时间的,如果有一家第三方公司能把这样一些问题解决,我们也非常愿意合作,这是一件非常有价值的事。
举一个简单的例子,比如说如果在座舱里面通过端侧模型感知到后面的小朋友有哭闹的情况,就能够最终靠端侧先去开启一个云端比较强的语言交互模型,说要不要一起聊聊天,分散一下注意力,给他讲一个故事。但这个开启的过程一定是要通过端侧来判断,而不是让云侧随时有一个模型在观察我们的座舱里面在做什么,这对隐私的暴露是非常大的。
因为端侧模型部署在各种硬件设备、走入千家万户和不同用户场景发生交互,它需要具备很好的自主学习能力,尤其是基于探索的内容做自我迭代和个性化发展。所以端侧模型提升知识密度很重要,面壁智能提出了知识密度每三个月提升一倍的观点。相对而言,云侧模型会更关注智能水平的提升,这二者之间的差异还是很大的。
站在作为端侧模型公司角度讲,我们跟高通这样的芯片厂商有非常深度的合作,只有这样深度合作才能够把端侧模型的知识密度能够真正发挥出来,能够去用更低的功耗去做到同样的工作。
另外在应用侧,他认为现在只有MCP这一种智能体协作方式肯定是不够的,还需要有更多基于用户认证的、安全的协同方式,这些是原来在移动网络时代建设过的基础设施,现在需要在AI时代重新做一遍。
AI孕育了一个非常大的机会点,它有机会把看似割裂的生态集中起来。其实很多终端现在都是一个生态的孤岛,比如PC的交互是鼠标键盘+图形界面,手机的交互是基于触控,AI这种基于对话的、更加自然的交互会是一个跨终端的统一交互模态。
今年理想汽车也在聚焦做这样的事,理想同学作为理想汽车的Agent,它接入了大量和汽车出行相关的服务。今年我们也开始接入车内空间以外的生活场景和服务,比如让理想同学点一杯咖啡、交一下水电费、叫一个代驾等。它会覆盖更多、更广泛的服务,我们始终相信未来用户选择Agent的核心和现在选择操作系统的逻辑是一样的。
不过能确定的是,未来在Agent的“穿针引线”下,还是能形成一个跨终端的操作系统,提供流转的智能服务。