汪伟:知识图谱在商业地产管理中的应用案例
平安科技知识图谱副总工程师汪伟
精彩观点:
商业地产管理摆脱传统的经验化,要将个案情况向整个面的关系网络覆盖,通过知识图谱的网络结构,把一个企业的方方面面,包括企业客户的供应商客户,以及周边的关联方全部放入全局视野,相当于上帝视角看到的技术体系里去看待来进行商业地产管理。
一、知识图谱的特征与价值
引言:知识图谱这个概念从表面上看它就是一些关系的点,比如张三和李四结合在一起会成为一对关系,两个实体有两个人,他们婚姻的关系是这样的关系对。在现实中,这种连接有些什么样的意义和价值?通常来讲,我们现在企业的关联,现在的分析,大部分可能还是基于Excel表格形式呈现的,但是这种表格背后跟我们直接生产经营是脱节的。大家注意到没有,一个企业的生产,包括房地产可能有很多上游供货商,钢筋、水泥、建筑队,这些作为输入,你才可以对这些材料进行加工设计,建筑出你的产品销售给客户,我们现在Excel所谓结构化表格的形式很难支撑现实中企业经营的情况。与此同时,需要注意的是我们提出的方案,2017年7月国务院人工智能规划里已经提到了知识图谱的概念。具体主要解决哪些问题,总结包括以下三点:
1)万数互联:智能整合海量数据,实现非结构化数据与结构化数据自由融合
前面嘉宾提到了5G,各种规划数据要打通,5G最直接的效果是万物互联,万物互联可不可以更进一步升华,比如你在企业里,事件可能跟某些人,人跟某些机构,机构跟某些里各种关系,供应商、客户,法院、行政官员或个人,这些形态现在基本上是割裂的。
我们现在提出一个新的观念,用万数互联的方式,把这些数据连接起来。在这种数据里连接的模式,以前可能是强关系,比如谁跟谁结婚,可能是一种强关系,但是有一种情况可能是弱关系的形态,比如今天开一次会,把大家召集到一起,这种联系相对是一种临时性,动态性的弱关系,有价值吗?是有的,比如谁跟谁打一场高尔夫球,后面的交易就会成功,这种情况我们通过这种关系形态进入会比较有效。
2)体系自洽:灵活的分析体系与技术中台,快速完成“建模”过程
这个涉及比较深邃和技术化的描述。风险分析中,金融公司做企业分析的时候有一个很大的问题,发现企业信息跟个人不一样,企业非常的割裂,平安集团这种体量在全世界也找不到几家类似的情况,还要分析信用风险、违约风险、破产风险、倒闭风险、资金链断裂风险。如果你跟他体量不相当,分析出来的结论不是很可靠,稳定性不高。
有没有什么办法提高风控的稳定性吗?这个逻辑界定了天文学的思想,天文学的思想有一个很重要的逻辑,哪怕再遥远天外的星体,它们都会假设去满足两个定律,第一个定律,外太空跟地球上的规律是一样的,同样满足我的牛顿定律,广义相对论等特点,这样的体系是支撑我们可以推演一个非常底层的逻辑。第二个定律,在太空或天体物理有一个很重要的情况,信息的非常少,无论多么少都能推断出你天体行星运转规律,比如我们做风控的评价,财务造价等风控评估方式都会遇到这个,主要核心逻辑是相互之间相互交叉校验。
3)因果推理:从信号预测风险,从时间推理影响,更具模型解释性
这涉及到底层的逻辑,我们现在所有分析的TOP都基于统计学的思想,统计学思想是建构在大数定理逻辑之上,大数定理一个很重要的前提是样本量要大,现实中我们很难具备这样的条件,尤其是企业里。
因果推理背后是演绎逻辑,类似于数学的推理逻辑。我们后面涉及到很多工作跟人相关,你就要一定讲原因和道理,比如医院开出来的药的成分讲不清楚你就没办法服用。你做销售,你跟销售说怎么打单,怎么跟对方接洽,没有比较好的明晰的因果关系的链条,他是很难操作,哪怕你给他一个名单。
二、传统商业地产管理现状
现状:我们现在面临的问题,从平安不动产做的项目里面分三个层次的工作,这是聚焦与商业地产管理,租赁这一块儿来讲的。这里分为三个,第一,智能招租的部分。第二,分层定价,怎么让定价更合理。第三,退租预警,有一定风控。我们接下来分三个层面讲,这三个东西其实我们整个儿入口的逻辑都是要有一定的问题来驱动的。
1)智能招租:变“被动出租”为“主动招租”,租户需求与租户质量双管齐下
我不知道其他单位是怎么样的,我们这边收集到的情况,我们整个儿租赁在第三方,包括我们会找一些中介,我们会找一些广告投放,无论找中介还是找广告投放,他都是第三方的情况,而且基本上是被动的,我把钱打给了广告公司或租赁公司,然后等着他上来的情况。这种情况相对比较被动的,可能是比较粗线条的管理模式,所以在这种情况下,我们在想有没有一种情况,因为这有第三方介入,你成本和客户聚焦性不是很够。
还有一种情况,你对客户的了解,以及对客户背后逻辑,他要租赁还是放弃租赁了解的情况都不是很够,我们想用一些AI模型或机器学习的模型,筛选一些精准的目标。具体的做法,一方面,我们用一些城市的数据,包括产业经济的数据,政策区域的数据,都会放进来。另外,我们会把商圈的客户流动,配套设施的信息都汇进来。另外,我们提到大量企业的结构和非结构化的数据,这里尤其有用的可能是一些公告,舆情新闻等新闻。
这里我要强调的是,这些东西大家看着都很寻常,我们不同的一点在于,我们在这个数据的组织方向,比如你财务数据,那三张报表是拿表格放好,大家有没有想过,这个数据是关联着企业背后上下游,供应链和产业链的逻辑,包括区域宏观经济层面的信息,如何让这些信息都能够放到你的模型中并且发挥作用,这是我们在底层数据,为什么要用知识图谱支撑很核心的逻辑,我们理解起来知识图谱相当于我们把麦子磨成面粉,它是一个工业品,化工行业有一个非常重要的化工材料乙烯,乙烯生产可以代表你工业水平发展的状况。我们现在这个是用网络性数据组织形态支撑你上面各式各样的分析,这里罗列推荐算法、决策树、层次聚类等等,都是在这个体系下找到应用的。我们现在做好了这个东西,上面数据组织好,应用层面会好很多,包括选址、推荐,相似裂变就是相似推荐的模式。这只是初阶的形态,后面纳入到客户整个儿进场,进场前、进场中、进场后,全面的客户贯彻。
2)分层定价:标准化“标签+书架+文本”知识库,辅助精细化分层定价
我们要先讲一个理念,传统定价模式是比较粗线条,基于经验式的模式,现实中业务需求给我们提出,他讲了一个例子,我们在超市里经常看到一种情况,无论这个超市长的怎么样,无论大小,是民营的还是知名品牌,超市首先要拿一些优惠的价格把一些知名品牌吸引进来,比如把可口可乐、百事可乐、宝洁、联合利华等这些上得了台面的品牌邀请进来,给他们最好的位置和最好的价格,针对他们进驻之后,我这里强势的企业已经进场了,再邀请其他企业。这里一定会有一个问题,你如何在优势的强势品牌入驻,中间品牌或弱势品牌之间寻求一个最好的平衡?业务的想法是,我先以比较低廉的价格或优惠的方案给到这些强势的品牌,他上面亏损的,或者没有达到我们预期的收益是不是可以转嫁到其他中等品牌或低端品牌上的分摊模式。这中间究竟该分摊多少?以什么时间?三个月进场,一个月还是一周,还是第二天马上进场,这些效果,这些量化的尺度我们怎么样以最好的均衡性的成果分摊出去给个定价。
通常我们车险的定价有三段的,第一段,你出险了多少次,包括赔付的金额。第二段,机器对你信用评级的打分。第三段,你所在的区域证监会给到的尺度,我营销人员拿到的上下调整的幅度。这样他三段式既满足了我盈利的基线,又满足我的灵活性,包括最大可能营收的最优解,这是我们现在要达到的目标,所以我们现在这样的输入信息量比较大,主要做的问题是全局最优,目标是使我们的收益达到最大化,整个全优考虑到入驻企业群聚效应和产业集群。
3)退租预警:AI预判预警租户退租可能性,预留业务介入“窗口期”
这是我们上线最早的,诱发的项目我们在去年平安一栋楼发生了提前退租,导致那一层楼空置出来的房层空了一两个月时间,亏损的金额是上亿的规模。后来领导说这种等待性,或者别人告诉你的形式太晚了,退租的时间窗口肯定要提前有所了解,你才有侯选的方案,给操作人员留下足够的时间,不然你的损失会比较大。
我们基于这样的目标做了三个东西。第一,退租风险的走势,我们针对每一个客户,以及每一栋物业的楼,看了整体的情况,像我们看员工要离职一样,通常有两种,一种是发展的好了,要走,这里装不下他。另外一种是发展的不太好,我们会把他识别出来,提前做一些沟通或及时的监测,让我们业务的同事更加精准或聚焦。我们后面有诱因挖掘和风险提示,我们有一些解释性,这些拿到业务手里有比较明晰的方式。
最后做一个总结,我们现在针对商业地产管理,我们想摆脱传统的比较经验化,个案的情况向整个儿面向覆盖。这里罗列的三个有内在的联系,整个儿承接是下面关系网络。除此以外,我们在政策分析和宏观经济方面,每个城市都会看他的GDP、CPI、KPI,政策出台有哪些提前性的预见等等模块,这一次没有放这些东西进来,无一例外,这些东西都在这个平台上运转的。综合起来,我们想通过知识图谱的网络结构,把一个企业的方方面面,包括企业客户的供应商客户,以及周边的关联方全部放入全局视野,相当于上帝视角看到的技术体系里看待。