AI多模态产业内容日益丰富
AI视觉是千亿级别的赛道。下游应用中,消费电子市场空间可达千亿级别,AI视觉内容市场空间也在千亿级,机器视检和自动驾驶是两个百亿级别的市场。数据表明,内容与AI技术的融合形成互为支点的发展格局,以AR/VR为代表的沉浸式多模态内容形态将改变人们的生活,成为新一轮增长驱动力。其中AI视觉生成式技术将对内容制作产生重要影响。
从感官体验看,AI视觉内容可以分为2D和3D。3D是技术进步的结果,可以作为2D的补充。
AI+2D视觉发展时间长并已成熟,是AI视觉内容的第一增长曲线。AI视觉技术工程化能力的不断成熟,促使以长短视频为典型形态的2D视觉内容产业呈现高增长。据Statista预测,2020年我国短视频市场规模为2051亿元,2021-2022年将分别达到2,884.9亿元和3,860.7亿元。AI算法及AI视觉生成式技术主导的短视频内容环境下,AI视觉创作软件成为创作者最重要的生产力工具。
AI+3D视觉处于行业初期但增速强劲,是AI视觉内容的第二增长曲线。随着AI视觉应用向三维、交互、实时生成的技术升级,以沉浸式为典型特征的VR/AR/XR多模态内容产业蓄势待发,并促进娱乐、零售、制造、医疗保健、培训和教育等产业内容发生变化。普华永道预测,全球VR/AR行业市场将从2021年1485亿美元增长至2030年1.5万亿美元。
AI多模态产业内容日益丰富,商业定制类增长最快
多模态内容按应用领域分为:游戏类、视听类、教育类、商业定制类四大类别。2020年游戏领域以40.5%的比例位居中国多模态内容领域的首位,视听类占比为20.1%,商业定制类占比约为14.2%。
数据显示,预计至2025年,中国多模态内容市场规模将达832.7亿元。未来5年内,增速最快的是商业定制类,其复合增长率高达55%,销售规模将达164亿元。
多模态内容产业链下游应用主要分为商业端(产业应用)和消费端(用户应用)两大类。前期发展主要以视听信息及内容为主的消费端驱动,当前发展主要以产业内容为主的商业端驱动。
AI+多模态视觉技术的成熟,使搭载于虚拟现实终端设备的三维多模态信息逐渐壮大,在影视、文化及娱乐领域遍地开花,视听类多模态内容形态成为主流。以Steam为例,截止到2020年底,Steam的内容(游戏及多模态内容应用)数量高达5554个。2017年威尼斯电影节上,官方首次设置了主竞赛VR单位,共有来自全球各地的22部VR电影入围,包括Sandma工作室《自游》、Pinta工作室的《拾梦老人》、上海魏唐影视的《窗》和蔡明亮与HTC、Jaunt合作的《家在兰若寺》四部华语电影入围。2019年视听节目《身临其境》上线,携手影谱科技AGC智能影像生产引擎在极短时间内生成一段AI视频,亦可以对节目的拍摄视频进行重构,如自动锚定关键帧,根据帧内容生成原图像中没有的、无违和感的内容,再智能化生成一段全新的视频。随之,众多主流官方媒体平台纷纷采用影谱AI生成技术来提供交互式数字内容服务。
在定制化的商业内容领域,AI自动化生成技术的应用进一步降低定制的制作成本,提高商用价值,AI化的多模态内容应用领域更趋于广泛,如企业培训、数字商业内容等都涌现出典型应用和企业。在数字商业内容领域,影谱科技以生成性AI与数字孪生技术为核心,围绕商品链的流通、营销、服务三个主要场景提供AI数字商业服务。相比传统线上零售方式,影谱不仅可以实现商品的多模态呈现,如一段机器自动生成的视频,甚至是一个交互式展现的三维图像,支持消费者把数字商品植入自己想要放入的虚拟场景,以直观体感来提升零售服务的智能交互体验,激发消费者的购买欲并加速转化。
伴随多模态内容在消费端的普及商业化,以及XR终端设备稳定量产,商业端的多模态内容应用快速增长,应用领域多样化,包括影视、营销、医疗、教育、房产、家居、零售、汽车、航空等。除在教育及培训领域的稳步增长以外,家居、汽车、房产、零售组成的商业“四驾马车”更是把AI多模态内容产业推向万亿级市场。
AI生成技术降本增效,是多模态内容行业关键技术
制作及发行是多模态内容市场主要成本,其中制作成本主要由人工成本、3D制作引擎、高性能计算机三部分构成。人工成本占制作比例高达90%,紧随其后的是高性能计算机和 3D引擎,占比分别是6%和4%。由此可见自动化的AI+3D生成引擎是内容领域降本增效的最佳手段。
多模态内容行业的主流制作引擎技术方包括以3D引擎为代表的Unity 3D及虚幻UE4,和以AI+孪生生成引擎为主的影谱ADT引擎。
游戏类多模态内容开发企业多采用3D引擎完成建模、细节处理、特效设置、三维处理等工作。当前较为通用的3D引擎为Unity和UE4等,该类软件以许可授权为单位向客户提供服务。
商业定制类多模态内容需求企业多采用AI+孪生引擎完成商品捕捉、细节处理、零部件三维处理、交互处理等工作。当前较为通用的AI+孪生引擎为影谱ADT,该类软件以定制化服务+许可授权向客户提供服务。
影谱科技ADT引擎是AI生成技术在商业化浪潮中快速崛起的多模态制作引擎。通过AI智能影像生成技术,对大量2D视频图像帧进行分析,以自动化3D建模空间化的形式进行展现,从而智能生成一段3D化的多模态内容。同时,在文娱商业内容、数字商业领域具有成熟的项目落地经验,与多平台建立长期合作关系。
Forrester清晰展现了影谱AI智能影像生成技术潜能。《Forrester 2019-2020年Video AI技术预测》报告显示,AI智能生成技术解决了大规模内容制作和特效制作成本高的问题。使用智能视频技术平台,可提高视频内容生产效率,降低人工成本60%以上。AI生产技术成为多模态内容制作的关键技术之一,有效降低内容生成、营销、搜索、数据流通的门槛,提升内容制作效率。
基于AI融合VR/AR、数字孪生等技术而生成的多模态内容,具备沉浸感、实时镜像、虚拟社交等“未来世界”元素。这是一个既脱胎于现实世界又与现实世界平行,且始终在线并不断迭代更新的数字世界,必将影响商业、企业、文化形态等方方面面。