拍拍贷科研再下一城:反欺诈研究成果收录国际顶级学术会议CIKM2019
11月3日-7日,CIKM 2019在中国北京举行,拍拍贷与浙江大学、加州大学洛杉矶分校(UCLA)联合发表的论文“UnderstandingDefault Behavior in Online Lending”被CIKM 2019录用,并作为口头报告(Oral)论文在大会中进行介绍。
CIKM(ACM International Conference on Information KnowledgeManagement)是全世界计算机领域影响力最大的专业学术组织ACM旗下年度会议,每年聚集全球学术界和工业界的顶级专家和研究人员,围绕大数据和人工智能的最新进展和研究热点进行深入探讨。据悉,今年会议投稿数目远超上届,最为严格的ResearchTrack长文收录率仅为19%。
首次通过社交网络验证不良中介
欺诈是金融行业面临的严峻挑战。对于借贷业务而言,用户欺诈与违约的表像相似,如何更有效地识别欺诈用户并进行预防是一个很具挑战性的课题,也受到金融机构的广泛关注。传统的反欺诈方式以规则为主,可以较好地将一些具有明确特征的欺诈分子挡在门外。然而,在杀伤力最为巨大的团伙欺诈中,由于团伙成员各有分工,核心的组织人员往往很爱惜自己的羽毛,表现得很有迷惑性,用常规方法很难识别。
由拍拍贷与浙江大学杨洋老师团队和加州大学洛杉矶分校孙怡舟老师团队合作完成的论文“Understanding Default Behavior inOnlineLending”,不再把用户看作孤立的、遵从独立同分布假设的个体,而是还原了用户之间的社交网络关系,构建由千万节点组成的复杂网络,利用网络结构特性去发现团伙欺诈中的不同角色和关系,进行有效识别和预防。
用户的社交关系跟是否欺诈很难有直接的关联,然而不良中介是团伙欺诈的始作俑者,跟欺诈有直接的关联。论文中创造性地引入不良中介这一特殊社会角色作为桥梁,并基于1100万用户的大规模数据集,揭示了不良中介不同于逾期用户和普通用户的社交网络特点。这也是就目前所知,第一次从社交网络特性角度对不良中介的存在进行验证,并且深入研究这一团伙欺诈关键角色在社交结构上区别于其他用户的特点。
论文还提出了一个全新的半监督学习框架——双任务因子图模型(如下图),对不良中介(y)和违约(z)这两个高度关联的预测目标进行联合建模,引入一个传导因子()来刻画这两个任务相互的影响,从而可以通过跟违约用户的关联情况来帮助更好地识别不良中介,通过跟不良中介的关联情况来更好地预测可能出现的违约。
双任务因子图模型
拍拍贷AI团队技术人员表示,这个框架提供了一个很强大的优势:当大量缺失其中一个预测目标标签数据的时候,可以通过另一个关联的任务对该任务进行增强。由于不良中介的标签往往依赖反欺诈专家进行调查来获取,十分昂贵,而这个框架可以在几乎没有已知不良中介标签的情况下实现对这一隐藏身份的有效识别,并且帮助提升对违约的预测。
据了解,该文工作的有效性在多个实验中得到了验证,并且作为拍拍贷明镜反欺诈系统的重要一环已逐步投入实际业务应用,大大提升了反欺诈的有效性和效率。
创新算法提升复杂网络表示学习质量
此外,由同一团队推出的另一篇论文“A Unified Network Embedding Algorithm for Multi-typeSimilarity Measures”中的工作也将在CIKM workshop GRLA上进行介绍。
据了解,该论文则是关于复杂网络表示学习,即,将庞大的社交关联网中的一个个节点,描述为向量,并且保持原网络在结构、语义、邻近等方面的性质。这个向量化的表示一般是复杂网络存储和查询、建模等下游应用的起点,表示学习的质量直接影响应用,所以受到广泛关注。
经典方法一般采用网络连通或者结构相似来作为节点相似的度量标准,而对不满足这种相似度量的数据和应用场景则效果不佳。比如逾期用户节点往往具有连通相似的特性,而不良中介往往具有结构相似的特性。
拍拍贷研究人员表示,在这篇文章中,提出了一个统一的算法框架,可以灵活学习不同相似度量的重要程度,从而可以方便使用同一套算法来应对不同的下游应用,对业务工程实践很友好。
作为头部金融科技平台,拍拍贷相关研究人员均来自海内外顶级高校和知名科技企业,并拥有来自加州理工大学、加州大学洛杉矶分校、浙江大学等高校的多名教授作为科学顾问,长期保持积极的合作。本次CIKM介绍的2篇论文也展示了几方良好合作的阶段性成果。
目前,拍拍贷自研技术已实现业务流程的全覆盖,如人脸识别、多场景OCR、声纹识别等多模态核身技术,语音识别、意图识别、语义理解等全流程智能对话机器人技术,基于复杂网络的不良中介识别和团伙识别技术等。未来,拍拍贷还将在智能投放、精准营销、核身、反欺诈和智能客服等金融场景推出更多的应用和研究成果。