商汤科技的AI密码:在虚拟与现实之间穿梭
来源:21世纪经济报道
2021年,科技圈火热的概念非“元宇宙(MetaVerse)”莫属。但元宇宙究竟是什么,业内尚无特别精准的定义,只知道从广义来看,元宇宙是一个与现实世界平行,却又无限逼近现实的虚拟世界。
对很多人而言,科幻电影《头号玩家》中呈现的剧情,或许就是最理想的元宇宙:只要带上一套设备,就能立即穿越到一个虚拟世界中,并在那里进行近乎真实的生活。
这个听起来都有些不可思议的场景,随着科学技术的不断迭代,或许在不久的将来,真的能够成为现实。当下,业内已经达成的共识是,要想实现虚拟世界与现实世界的连接,必须依赖于虚实结合基础设施的建设。
而随着这个基础设施的能力变强,虚拟与现实的连接也会越来越强,2D、3D的边界会逐渐模糊,次元壁也将能得到突破。因此,科技企业奔向“元宇宙”的主要征程,就是需要打造出实现虚实结合的基础设施。
过去几年,很多专注前沿技术发展的科技企业都围绕“虚实结合”进行了探索,其中也包括了人工智能领域的领军公司商汤科技。经过七年的发展,商汤已经成为中国AI领域最具代表性的企业之一,与此同时,它也找到了可以帮助人们在虚拟世界和现实世界间穿梭的解题密码——SenseCore商汤AI大装置。
“大装置”的冒险
在上海临港新片区,有一片占地约5.8万平方米的庞大建筑,这是商汤投资56亿元打造的新型人工智能计算中心(Artificial Intelligence Data Center,简称AIDC)。
据悉,商汤AIDC的算力峰值可达到3740 Petaflops(1 Petaflop等于每秒1千万亿次浮点运算)。这是什么概念?如果用它来处理视频,一天内可以处理长达2.3万年的视频,这意味着可把人类从新石器时代至今所有时间录成的视频在一天内计算完成。
然而,仅有强大的算力还不够。人工智能的三要素是数据、算法和算力,如果将其看作一辆汽车,那数据就是燃油、算法是方向盘、算力是发动机,要想让汽车高速行驶,三者缺一不可。
所以,商汤科技将算力、算法和平台三位一体,有机整合,推出了其前瞻打造的新型人工智能基础设施——SenseCore 商汤AI大装置。
之所以要叫做“大装置”,是因为商汤想将其类比为高能物理中的粒子对撞机。在高能物理中,通过随机的两束粒子流的高速碰撞,可以去寻找量子粒子的新规律以及新粒子。然而,这些粒子的碰撞结果都不可预测,只有通过不停的尝试,才有可能找出一些真正意义上可解释物理世界的规律。
而商汤的AI大装置,也是希望通过不断的尝试和迭代,来进行人工智能的可能性探索。对于自成立之初就专注于AI领域的商汤而言,AI大装置可谓其过去七年实践的集大成者。
可以看出,与近两年超大规模人工智能算力中心才受到外界关注不同,商汤对此的布局时间要更早。甚至在2018年,在没有任何可借鉴经验的背景下,商汤科技就在总部办公大楼内搭建人工智能计算原型机进行项目预研。
无论是前期的预研,还是后来的正式项目,这一切,对于尚处于创业阶段的商汤科技来说,都是面临巨大风险的大冒险。但在商汤看来,不管是持续发展和长线竞争,还是AI技术的演进,打造AI大装置都是商汤的必选项。
通常来说,构建一个可与真实物理世界连通的数字化世界需要三个步骤:一是场景的数据化;二是要素的结构化;三是流程的可交互化。
过去,绝大多数人工智能公司所做的事情都是实现第一步,而之所以迟迟没有大规模进入第二步,是因为行业中出现了越来越多的长尾细分需求,如果没有通用人工智能,这些长尾场景则要耗费巨大的人力、成本。
而商汤打造的AI大装置,则是希望推动AI产业步入第二和第三步骤。商汤科技联合创始人、首席执行官徐立曾表示,AI大装置将能够真正意义上降低人工智能生产要素的价格,从而推动物理世界的全面数字化转型。而这,也是实现虚实结合的重要前提。
从行业价值来看,商汤的AI大装置首先可以降低算法模型生产的成本,加速人工智能规模化落地;同时借助其强大的泛化能力,可以解决很多长尾场景的问题,进一步实现商业价值闭环;最后,AI大装置也将催生全新的商业模式,构建出物理空间的数字化搜索引擎及推荐系统,进而实现了物理世界的全面数字化。
把虚拟照进现实
当然,真正的虚实结合,光把现实世界投射到虚拟世界中还不够,还要真正实现虚拟与现实的融合和交互。而想要做到这一点,就需要让虚拟世界中的人和物能够认识和理解现实世界,并做出精准的反馈。
为此,商汤科技原创打造了“SenseMARS火星混合现实平台”,通过联合浙江大学-商汤三维视觉联合实验室共同研发并整合了一系列的领先AI和MR技术,具备了包括高精度三维数字化地图构建、跨平台和终端的空间感知计算、全场域厘米级的端云协同定位等空间定位和构建能力,可以让虚拟世界与现实世界精准叠加,并与之交互。
浙江大学教授章国锋曾谈到:“通过将AR技术与商汤领先的AI技术深度融合,借助其对场景和物体的准确识别、语义分割与理解,可以让虚拟元素更精准地认识和理解现实世界,从而进一步提升AR应用的想象空间,并将其融入到人们生活和工作的方方面面。”
如果把商汤SenseCore AI大装置看作是AI生产的流水线,高效地将物理世界数字化,构建数字孪生;那么SenseMARS则代表着虚拟世界通往现实世界的窗口,通过它,虚拟可完成“现实的增强”。
目前,SenseMARS已在多种线下场景得到应用,如智慧场馆、景区、文博馆、游乐场所、大型商超、机场交通枢纽等。比如去年9月,商汤便在杭州西湖风景区打造了一条虚实结合的AR游览路线,游客只需借助手机App对着实景扫一扫,就可以开启AR导航导览模式,在放鹤亭与飞舞的虚拟仙鹤合影,或在岳王庙前领略万马奔腾的震撼景象。商汤通过虚实结合为游客创造了一种全新且更具互动性的旅游体验。
而今年7月份,商汤科技联合BilibiliWorld共同打造的MR(混合现实)虚拟体验馆,更是让很多玩家置身到了由AI+MR创造的“元宇宙”当中。在虚拟体验中,商汤通过AI技术让以往只能以二维卡通形象出现在视频里的虚拟主播真正走进现实世界,以三维形象出现在体验者的面前,与他们进行跨时空的互动和交流。
除此之外,更令人兴奋的是“虚实结合”还催生了一些全新的商业模式和生活方式。当我们真正打开人工智能的想象空间,虚拟世界和现实世界的交互也将得以实现,比如基于一个有业务价值的数字世界的构造,可以让我们直接在虚拟世界中搜索并且影响现实流程。
在上海商汤科技大厦的智能办公系统中,有一个“万物检索”功能。基于该功能,商汤科技的员工可以在系统中搜索丢落在公共区域的车钥匙、笔记本电脑等任何物品,而搜索结果会将该物品在3D地图中标注出来。
这个场景的实现,并不是通过将车钥匙、笔记本电脑等物品进行联网定位,而是基于整个商汤科技大厦的数字化构造。所以,这也是在超级算力的前提下,“虚实结合”为行业带来的全新想象。
同样的场景也可以出现在奥运赛场上。比如冬奥会场馆水立方,基于商汤的AI大装置,可以通过场景数据化将其3D结构重建出来,接着再把场馆内所有人、物、场景进行结构化,最后,整个水立方就完成了数字化构造,无论是教练对运动员的知道,还是观众之间的互动,都可以在上面进行迭代。
经过多年的发展,人工智能已经不算是一个新兴技术,在很多领域,人工智能的应用更是早已成熟。当下,很多从事AI业务的公司所做的事情,都变得大同小异,但从一个技术的演进角度来看,业务场景趋同并不是一个好的现象。
这个时候,商汤科技站出来做行业的破局者,既展现出了其多年AI技术能力积累的自信,也体现出作为行业头部企业的担当。可以看出,无论是SenseCore还是SenseMARS,商汤科技都是通过最前沿的布局,在为AI行业探路。
今年年底,商汤在上海临港建设的AIDC即将竣工,它将代表亚洲的最强算力。商汤也表示正逐渐将AI大装置的强大能力开放给企业和行业。它对整个AI产业将带来怎样的影响值得关注,与此同时,它将拉近多少人们与“元宇宙”的距离,也值得期待。