大数据生死“劫”:个人金融信息“产业化”的前生今世
大数据生死“劫”:个人金融信息“产业化”的前生今世
本报记者 李晖 蒋牧云 北京 上海报道
退一步可能海阔天空,进一步却可能跌入深渊。
深受公众质疑的大数据公司正面临着生死考验,之所以饱受质疑,是因为他们掌握着大量的个人信息甚至隐私,而这些个人信息又经常被侵犯和转卖,卖房、卖车、贷款甚至催收等各种信息令公众不胜其烦;与此同时,正规的金融机构们在风控中又离不开大数据的支撑,尤其是网络信贷和个人信贷。
最终,国家相关部门在2019年下半年开始对大数据行业大力整顿。
不过,经过2019年整肃风暴后的数据行业向何处走,现实仍旧没有给出明确答案。
近日,有消息称知名大数据公司的裁员蔓延至国际部门,部分员工受到波及。事实上,大数据行业自去年下半年以来一直动荡不断。行业内员工被抓捕、被调查、被裁员及主动离职的消息不断传出。
一家北京头部数据公司内部人士向《中国经营报》记者证实,“优化”确实在发生。“由于数据核验业务目前不能做了,这部分人力要向评分、建模、语音质检方面去转。”
“年前已经集中面试了一批来自此前涉事头部数据公司的求职者,岗位涉及销售、数据分析、建模等各个板块。其实不需要等着被裁,从业者们也会及时脱身。”一位国资背景数据公司高管透露。
行业整肃风波未平,涉及个人金融信息政策持续收紧,伴随疫情笼罩,数据行业何去何从?
模式停摆:“拿不到数据了”
去年以来由爬虫整肃风波引起的数据荒还在持续。
“现在业内风声很紧,整肃风波后,已经没有数据源敢开放数据的接口给第三方数据公司了,尤其是此前的涉事机构,这直接导致大批数据公司此前最依赖的通道类业务停摆。此外,对于没有数据源的大数据公司,爬虫业务的全部下线导致的业务调整是必然。”前述高管向记者表示。
在互联网信贷链条中,不论是注册审核还是放贷前的风控审核,对于客户提交的个人信息真实性核实都是第一步,包含对姓名、身份证、手机号、银行卡等信息的核实,除此之外,还要了解该名客户的其他个人画像,比如不良记录、资产、工作、学历、朋友圈等多维度数据,在获得客户授权的前提下,信贷机构可以通过从数据公司调用上述信息快速完成对借款人风险把控。在商业模式上,通常按照调用数据或者报告的次数计费,此前数据行业的头部公司可以达到每天百万级甚至更高的调用量。这项业务模式简单,却占据大部分数据公司七成以上的业务规模。
业内人士告诉记者,此前第三方数据公司依靠自身爬取或者对接数据源,能够支撑每日海量高频的数据调用,但从数据来源看,多数无法深究。“肯定有合规来源,但大多数不合规。可能有交换的、可能有从黑产买来的,但大部分是‘爬’来的。”随着行业风声骤紧,这些数据的合法合规性受到质疑,数据供给和业务模式受到直接冲击。
前述高管告诉记者:此前市场上的大数据公司,按照服务模式不同,主要分三大类:第一类,数据通道代理类公司,上游有可靠的数据源,以代理方式直接与数据源对接,以“批发零售”的方式对外开展服务,这些机构多有接近数据源头的资源背景。第二类,以合规或非合规技术手段收集数据,通过对拿到的数据做加工整合、变量处理,形成自身的数据产品后再对外提供。第三类,是拥有较强的大数据处理和研发能力,为金融机构提供大数据建模层面的咨询和技术系统搭建类服务。三种主要类别之外,还存在着大量数据贩子等灰色产业。
“查询数据是有成本的,以身份验证每次一毛到三毛的市场平均价,数据公司或互金平台每天为此花费数万元甚至数十万元是相当常见的。因此大家通过各种手段压低成本,既包括‘爬’或者找黑产买,也包括把‘经手’的数据留存下来进行‘再利用’,一旦形成规模效应,相关数据产品的报价甚至可以低至几分钱。”一位上海征信行业资深人士透露。
记者采访了解到,在国内大数据立法真空背景下,此前几乎七成以上的公司核心展业模式都是以爬虫技术为手段、以买卖客户数据为利润支柱,近年来快速做大了业务量。
但去年以来,爬虫业务下线和传统互金客群范围萎缩形成了恶性循环。记者从某上海数据公司人士处了解到,随着监管方面的全面排查,目前全行业的爬虫技术,以及公安系统法律诉讼信息等相关服务都已经停止,因此部分原先以爬虫相关服务著称的企业受到影响最大。“此前这些大数据公司的客户五成为现金贷平台,现在整个行业的业务量缩减了一半,加之目前疫情的影响,业务推进是走一步看一步。”
前述国资数据公司高管就直言:此前一些大数据公司的反欺诈业务做得确实很好,但未来数据成本变高了、一部分业务不能做了,一些上过黑名单的数据公司银行与其合作会有顾虑,都会挤压数据公司的生存空间。
缓存可“致命”