文 | 钱钱
编辑 | 阿景
今年AI圈有个词特别火具身智能,简单说就是让机器长出手脚,能跟物理世界互动。
就在上个月,商汤科技突然宣布成立一家子公司“大晓机器人”,直接把枪口对准了这个赛道。
商汤在AI圈摸爬滚打这么多年,从最早的视觉算法到后来的大模型,每次出手都挺有章法。
这次搞具身智能,不少人猜是跟风,但了解内情的都知道,这步棋他们其实铺垫了很久。
为什么偏偏是今年?圈内人都在说,如今是具身智能落地元年。
以前机器要么只会看不会动,要么动起来像个“路痴”,现在大模型和传感器技术上来了,总算有机会让机器真正“走进”现实世界。
从“教机器走路”到“学人类干活”,商汤的技术破局点在哪?
传统做具身智能,有点像教小孩走路,摔了跟头才知道疼。
商汤反过来,先派团队去观察工人怎么拧螺丝、消防员怎么爬梯子,用摄像头、传感器把这些动作细节全记录下来,再让机器学。
这套思路有个专业名叫“以人为中心的技术范式”。
以前做机器人总想着让机器自己学走路、学干活,结果试错成本高得吓人。
商汤这套思路,相当于先让机器“看懂”人是怎么干的,再照着学,靠谱多了。
支撑这套范式的是他们新搞出来的“开悟世界模型3.0”。
简单说,这个模型能同时处理视频、声音、力反馈这些信号,不光能看懂动作,还能预测下一步该咋做。
比如看到工人拧螺丝,它能算出拧几圈最合适,力气用多大不会滑丝。
技术路线定好了,接下来就得考虑怎么把图纸变成产品,毕竟AI公司做硬件,可不是画几张PPT那么简单。
大晓机器人团队一开始也想省事,直接买现成的机器狗底盘组装。
本来想省点事,但后来发现市面上的机器狗要么视野太窄,看不到头顶的障碍物,要么一下雨就罢工,根本没法在户外用。
无奈之下,他们只能自己下场搞联合研发。
比如跟做全景相机的Insta360合作,把鱼眼镜头装在机器狗头上,这下视野一下开阔了180度,连天花板上的水管都能看清楚。
光搞定眼睛还不够,机器狗的“腿脚”也得靠谱。
商汤这些年投了不少做电机、传感器的小公司,现在正好派上用场。
他们出硬件设计规范,合作伙伴按图纸生产,自己则专心打磨模型算法,有点像手机行业的“安卓模式”。
机器狗先上岗,家庭机器人还远吗?具身智能的落地节奏
硬件难题一个个解决,接下来就得看这些机器人能去哪儿干活了。
具身智能听着玄乎,最终还得靠场景说话。
短期内最有戏的还是四足机器人,也就是机器狗。
现在不少工厂、变电站都需要巡检,人跑一趟又累又慢,机器狗要是能自己导航、避障,一天能跑好几圈。
商汤在智慧城市里积累的空间地图技术,刚好能帮机器狗认路。
中期来看,快递仓库可能是个爆发点。
那些放零食、日用品的前置仓,货架不高,路径固定,刚好适合机器人跑来跑去搬东西。
标准化程度高,自动化起来也容易。
长期嘛,家庭场景肯定是块肥肉,但难度也最大。
你想啊,让机器人进家门,万一碰倒老人、咬坏家具咋办?安全性这关得过,还得学会跟人“好好说话”,这可不是三五年能搞定的。
从最早做手机摄像头算法,到后来搞大模型,再到现在的具身智能,商汤的技术路线其实一直没跑偏。
都是围绕“让机器理解世界”这个核心,只不过以前是“看”,现在是“做”。
AI这行技术积累特别重要。
就像盖房子,地基打不牢,楼越高越危险。
商汤前几年在视觉算法、大模型上的投入,现在都成了大晓机器人的“家底”。
现在具身智能赛道有点像几年前的自动驾驶,大家都在找突破口。
以前都盯着“大脑”,现在发现“小脑”也很重要就是机器人的运动控制能力。
大晓机器人团队现在也在啃这块硬骨头,毕竟光会想不会动,啥也干不成。
具身智能这波浪潮里,商汤算是押对了方向。
大晓机器人能不能成,现在下结论还太早,但至少他们找到了一个突破口用“以人为中心”的思路,让AI真正走进物理世界。
未来要是真能把机器狗、物流机器人做起来,整个行业的玩法可能都得变。
上一篇:系统的融化,从AI赋能到AI原生