重磅!顶级国际期刊收录360数科首创的GBST算法
长期以来,如何以最优策略与手段化解信用风险是金融行业每家机构持续钻研的课题。就在近日,360数科白苗君、郑彦、沈赟研究发表的论文Gradient boosting survival tree with applications in credit scoring(GBST算法在信用风险领域的应用),一举被关注各个领域中技术方法应用的运筹学杂志——英国老牌顶级运筹学期刊Journal of the Operational Research Society收录。360数科风控研究团队以目前国际上信用风险分析领域最热门的前沿模型“生存分析模型”为切入点,结合集成树模型,更加精确地刻画风险随着时间的变化趋势,从而做出更加精准的风险决策。
随着互联网金融和电子商务的快速发展,中国消费金融市场近年来进入了市场爆发期。尽管信贷需求大量井喷,但是央行征信报告的覆盖率却不高,很多信贷机构不得不使用大量稀疏异构的数据来进行信用评估。因此,信用基础设施的缺乏让中国的信贷机构面临严峻挑战,更先进的信用评估技术呼之欲出。
360数科在信用风险评估层面应用的生存分析模型最初源于处理死亡数据,是保险精算、生物医学领域广泛应用的热点模型。生存分析作为一种传统的统计方法,用于处理生命周期数据,探索生存时间的分布情况。360数科研究团队意识到,生存分析考虑了时间维度的概率预测问题,如果应用在信用风险领域,能够相比传统的信用评估等模型在预测违约的可能性之外,进一步预测用户何时违约。除此之外,模型还能够刻画用户由于非违约事件而发生的借款中止行为,如提前还款、转向其他贷款公司等情况。
中国消费金融市场研究报告表明,金融业务不断下沉到更加广泛的人群,而这部分人群征信数据的大量缺失导致需要其他多元化的数据来弥补,由此产生了大量的三方资信、行为的数据。而这些数据的高维稀疏异构的特点对传统的信用模型来说带来了极大的挑战,而集成学习模型的框架却可以很好地解决这一问题,其通过多个学习器的组合,对不同特性的数据进行处理建模,泛化能力明显优于传统的单一学习器。结合生存分析可以处理时间维度问题这一优势,360数科提出以生存分析模型为基础,结合boosting的集成学习算法框架的梯度提升生存树(GBST)算法,以预测用户在不同时间段的风险概率分布,通过优化总体损失,大大减少每个时间段预测概率的误差,以达到降低风险的目的。
在风控场景中,该算法可以更精准地预测客户发生分期借款后每期的违约概率,用最小的时间成本进行未来更长期的风险决策,如贷前风险准入、贷中优质客群捞回等。除此之外,该模型可以帮助风控策略制定更加合理的额度、定价及期数策略,实现个性化产品定制。
在营销场景中,通过GBST算法对存量客户在时间维度上进行动态借贷意愿预测,辅助营销部门进行用户营销,助力于实现多样化、多客群、多状态的线上营销策略,在节约营销成本的同时提升成功率及用户转化率。
一直以来,360数科领先的风控成绩深受全行业的认可。目前,360数科申请的GBST专利已获得国家知识产权局授权。在公司申请的804项发明专利中,涉及大数据风控全流程管理的核心技术比例超50%。可以说,风控算法与策略的前沿探索是其保持先进性的独特秘诀。
(图为360数科提供授权中国网财经使用)