今年 8 月,微软官宣停产Azure Kinect DK,由中国3D视觉感知龙头奥比中光接手该技术产品线。这则消息,意味着“Kinect”这一颇具传奇色彩的名字正式成为历史。
说起来,Kinect最初只是用来玩体感游戏的外设,却无意间开启了消费级机器传感设备的新纪元,带动了3D视觉技术在产业端的应用,成为了现代科技产品史上的一大里程碑。
在5G、人工智能、机器学习浪潮下,本世纪的科技产品可谓是异彩纷呈。从微软的体感游戏鼻祖Kinect到划时代的iPhone,再到今年大火的具身智能和人形机器人。本文就来盘一盘那些具有“划时代”意义的硬核创新,如何展现出技术与产业迭代发展的脉络。
消费级体感设备鼻祖:微软Kinect
在消费电子届,获得“最畅销消费电子设备”吉尼斯世界纪录的不是iPhone,不是Switch,而是微软第 一代Kinect。
微软Kinect一代3D相机
iPhone初代总销量 130 多万台,而微软Kinect一代2010 年上市 60 天内销量就达到了 800 万台。当时的Kinect还是个给Xbox打工的“小弟”,通过手势识别、身体骨骼检测、语音识别控制等技术,为游戏玩家提供更真实的体感游戏体验。
虽然由于游戏开发供应不上,Kinect一代仅在市场上存活了 7 年,但在技术和应用上的开创性是毋庸置疑的。甚至后来苹果开发的Siri语音助手、亚马逊的Echo智能音响、谷歌的Project Tango,都得称Kinect为“前辈”。
2019 年,也是Kinect一代停产的两年后,微软推出Azure Kinect 开发者工具包,为Kinect打开了更广阔的商用天地。
微软Azure Kinect DK
Azure Kinect被称为小型AI终端,它面向开发人员提供深度、视觉、声音和方向四大类传感器SDK,还有Azure云端加持,如果说传感器能让机器“看见世界”,那Azure就可以让机器“看懂世界”。
今年,微软宣告了Kinect的终章,但也通过与奥比中光合作,开启“中国版Kinect”新的序曲,也是新的Femto系列iToF相机。该系列目前一共三款产品,Femto Bolt、Femto Mega、Femto Mega I,三者有着各自的优势,适用于不同场景。
Femto Bolt具有Azure Kinect相近的操作模式和性能,可以实现“无缝替代”;而Femto Mega性能更为强大,搭载了NVIDIA Jetson Nano深度算力平台,能摆脱相机对外设算力的依赖;Femto Mega I 则拓展了工业领域应用场景。奥比中光在高精度深度摄像头领域有着深厚的研发设计制造经验,与微软、英伟达的合作带来了新品在外观、算力、质量等多方面的提升,能更广泛地应用在机器人、工业自动化、虚拟现实、增强现实、人机交互等领域。
微软与奥比中光、英伟达联合打造的Femto系列
重回三维世界:微软HoloLens
HoloLens是微软 2015 年发布的可穿戴式增强现实计算设备,跟Kinect是“亲兄弟”,父母都一样(研发领军人都是Kipman)。
微软HoloLens 2
Kinect负责的是把现实输入到虚拟世界,而HoloLens的作用则在于把虚拟世界输出到现实中。Kipman对HololLens的最初期望是“手机终结者”,再次革新人类与数字世界的交互方式,让人类重新回到三维世界中去。
HoloLens有点像“头戴式Kinect”,通过采用间接飞行时间深度传感技术,进行实时的三维信息计算和重建,前面提到的Femto系列用的也是这一技术。
使用者带上HoloLens后,能够在现实环境中看见并直接操作各种虚拟物体,进行真正的“无实物表演”,比如在空气中弹钢琴、敲键盘、看电影……HoloLens还具备自主定位与跟踪,手势和语音控制等功能。
微软HoloLens
虽然HoloLens能让使用者化身科幻电影主角,高昂的价格和有限的应用依旧限制了它的发展,和Kinect类似,HoloLens在商业应用中找到了自己的位置。 2017 年,福特汽车引入HoloLens进行汽车工业设计,它可以帮汽车设计师更直观地向“产品经理”进行模型展示,随后工业制造、教育、医疗保健等行业也开始应用HoloLens。 2019 年发布的HoloLens2 新加了眼球追踪功能,对处理器和HPU进行了升级,还推出了定制服务,商用优势更明显。
不被理解的天才:iPhone
曾经iPod是苹果最成功的产品,但随着手机开始提供MP3 功能,苹果感受到了危机。为了增强iPod竞争力,苹果开始尝试给它“添砖加瓦”。 2004 年,有了能上网的iPod,而 2007 年,有了能听音乐的iPhone。
这个搭载着3. 5 英寸显示屏的“手机异类”最初并不被同行看好。初代iPhone的总销量是 130 万部,远不及当时的诺基亚、摩托罗拉、索爱等。而iPhone的后劲,超乎当时的人们对手机的想象。
初代iPhone第 一个创新就是在透明手机屏上使用多点触控技术,这个技术已经彻底改变了人类与数字世界的交互方式,甚至改变了思维方式。想起前不久看的一个综艺,节目里一个三岁的小孩,看到墙上的投影后第 一反应是直接用手试图操作投影界面,节目里大人看到后不住发笑,但转念一想,这不就是增强现实在干的事吗?
iPhone干的第二件大事,是推出了App Store软件平台,这一创新不仅改变了运营商和手机厂商的关系,还彻底改变了手机的角色。
iPhone之前,大多数手机像是升级版“对讲机”,是为不同的运营商导流的无线通讯设备。尤其在欧美以及日本,用户要先和运营商签入网协议,再购买运营商提供的合约机。而App store将手机变成了游戏机、阅读器、影音娱乐设备、照相馆、购物商城……iPhone不只是改变了手机行业,更创造了新的生活方式。
生不逢时的初代家庭机器人:JIBO
早期人类对家庭机器人的想象总是因朦胧而满怀温情,就像本世纪初的电影《机器管家》、《人工智能》里,期待着机器人成为家庭的一份子。然而 20 年过去了,想象被现实狠狠地泼了一盆冷水。
2017 年以 899 美元发售的JIBO应该算是第 一台面向市场的家庭机器人,它的研发领军人是MIT博士Cynthia Breazeal。早在 2014 年,JIBO就上线了产品众筹平台Indiegogo。圆乎乎的身体,可爱的表情,搭载语音识别、人脸识别、机器学习技术,“智商”和“情商”兼备,基本满足了人类对家庭机器人的期待,最终项目以230%的成绩超额完成众筹目标,足以说明市场对它的期待。
2017 年正式发售后JIBO荣登《时代周刊》封面,被评选为年度 25 大最 佳发明之一, 2018 年还获得了拉斯维加斯CES机器人类别的年度创新奖。
然而昙花一现, 2018 年Jibo就把所有知识产权出售给了一家独立的资产管理公司, 2019 年关停服务器。
原因有很多,不过最主要的恐怕还是市场需求问题。在 2014 年众筹到 2017 年上市这段时间,亚马逊推出了首 款智能音响Echo,实现了语音控制; 2017 年推出迭代后的Echo Show,搭载触控屏,能提供家庭娱乐、家电控制、家庭通讯等功能,而价格仅为为同期发售的JIBO的1/4。与此同时,各种智能家居产品迅速涌现。相比之下,JIBO价格高昂,功能也有限,实在难以找到立足之地。
不过无论是外观还是功能,现在很多家用机器人身上还是能看到JIBO的影子,JIBO也算是当之无愧的初代家庭机器人。
从“钢铁版气球人”到“杂技演员”:人形机器人Atlas
2009 年,Atlas前身——波士顿动力打造的双足机器人原型机Petman“精彩”亮相,细长的双腿在履带上摇摇晃晃弱不禁风的样子,像极了商场门口的气球人。
Atlas前身双足机器人Petman
4 年后,初具人类外形的Atlas原型机面世。大腿强壮了不少,还有了胳膊,但依然没有摆脱电缆的束缚。直到 2016 年,Atlas终于开始独立行走并施展了初级“职场技能”——搬砖。
2016 年的Atlas机器人
接下来Atlas的每一次亮相,都会赚取“哇声一片”。 5 年时间里Atlas先后解锁了后空翻、跑步、爬楼梯、倒立、空中一字马、跳舞、跑酷等技能,成为了人形机器人中的天花板。
双足人形机器人的自主平衡性和运动稳定性一直是学术界研究的难题,而Atlas通过IMU、关节位置和力传感器来控制身体并感受地面获得平衡,其运动技能的进化代表着人形机器人技术的飞跃。
而 2021 年能进行障碍跑酷的Atlas还具备了机器学习技能。之前的Atlas是通过事先编程完成运动,而 2021 年的Atlas搭载了深度相机,能感知环境,通过收集距离数据生成环境点云,进而“自行”规划行动路径。
由于制造成本高昂,市场需求不明,人形机器人的商业化目前仍是难题。不过尽管如此,人形机器人还是代表着世界最前沿的科研与产业方向之一。国外如特斯拉、谷歌、三星等巨头早已入局人形机器人,而在国内,来自华为的“天才少年”稚晖君也选择人形机器人方向创业。人形机器人这一充满未来感的产品,或许也可以在不远的将来走进千家万户。