十大网赌网址 > 世界历史 > 图算法如何刻画申请人群中的高危特征,拍拍贷

原标题:图算法如何刻画申请人群中的高危特征,拍拍贷

浏览次数:153 时间:2019-11-18

11月3日-7日,CIKM 2019在中国北京举行,拍拍贷与浙江大学、加州大学洛杉矶分校联合发表的论文“Understanding Default Behavior in Online Lending”被CIKM 2019录用,并作为口头报告论文在大会中进行介绍。

图片 1

网络黑产,无孔不入。

CIKM(ACM International Conference on Information Knowledge Management)是全世界计算机领域影响力最大的专业学术组织ACM旗下年度会议,每年聚集全球学术界和工业界的顶级专家和研究人员,围绕大数据和人工智能的最新进展和研究热点进行深入探讨。据悉,今年会议投稿数目远超上届,最为严格的Research Track长文收录率仅为19%。

前言

如你所见所闻:诈骗、盗号、冒用身份……花样百出、层出不穷。

首次通过社交网络验证不良中介

关于图的论述起源于经典的柯尼斯堡(Konigsberg)问题,最早的文字记载出现在欧拉1736年的论著中。经过几个世纪的发展,图论及相关算法已经取得了充足的发展。所谓图,就是由若干节点及连接各节点的边抽象而成的图形,通常用来描述事物之间某种特定的关系。图有很多存在形式,如地图、社交网络图、资金流图和企业关系图等,相伴产生的应用有很多,如邮递员问题、社交网络分析、反洗钱模型和企业风险评估模型等。图算法在图的基础上刻画节点与边的各种特征,如最短路径、连通子图、社区发现和标签传播等。

面对千亿级的黑产市场,我们经常愤懑道:黑产真是丧心病狂!

欺诈是金融行业面临的严峻挑战。对于借贷业务而言,用户欺诈与违约的表像相似,如何更有效地识别欺诈用户并进行预防是一个很具挑战性的课题,也受到金融机构的广泛关注。传统的反欺诈方式以规则为主,可以较好地将一些具有明确特征的欺诈分子挡在门外。然而,在杀伤力最为巨大的团伙欺诈中,由于团伙成员各有分工,核心的组织人员往往很爱惜自己的羽毛,表现得很有迷惑性,用常规方法很难识别。

1、图算法与反欺诈

图片 2

由拍拍贷与浙江大学杨洋老师团队和加州大学洛杉矶分校孙怡舟老师团队合作完成的论文“Understanding Default Behavior in Online Lending”,不再把用户看作孤立的、遵从独立同分布假设的个体,而是还原了用户之间的社交网络关系,构建由千万节点组成的复杂网络,利用网络结构特性去发现团伙欺诈中的不同角色和关系,进行有效识别和预防。

在现实世界中,从实体的图(像路网、电网和互联网等)到虚拟的图(像微博、朋友圈和通讯录等),图的存在形式各有不同。在反欺诈应用中,网络中实体(如人、设备、邮箱、卡号等)都可以用节点表示,而这些节点在业务中的关联可以用边表示。通过不断构建再现这些关联,进而探查欺诈特征并设计风控策略。下图展示了一个真实现金贷场景的欺诈团伙,三个严重逾期的子团在图中清晰可见(图片来自众安自主研发的Xanalytics®智能分析平台,关于该平台想了解更多,请看文末联系方式)。

BUT!!!在“智能金融”时代,“魔高一尺,道高一丈”,只要瞄准黑产死穴,就能对欺诈行为各个击破。

用户的社交关系跟是否欺诈很难有直接的关联,然而不良中介是团伙欺诈的始作俑者,跟欺诈有直接的关联。论文中创造性地引入不良中介这一特殊社会角色作为桥梁,并基于1100万用户的大规模数据集,揭示了不良中介不同于逾期用户和普通用户的社交网络特点。这也是就目前所知,第一次从社交网络特性角度对不良中介的存在进行验证,并且深入研究这一团伙欺诈关键角色在社交结构上区别于其他用户的特点。

图片 3

独有的关联维度挖掘、专业的欺诈团伙识别、科学的量化分级模型以及严格的金融场景验证,百度金融以人工智能和大数据风控技术为基础的“磐石反欺诈工程平台”在实时监测、判别欺诈行为、无缝对接金融风控上,正与金融机构合作伙伴们一道,建筑起立体的反欺诈防护盾。

论文还提出了一个全新的半监督学习框架——双任务因子图模型这两个高度关联的预测目标进行联合建模,引入一个传导因子()来刻画这两个任务相互的影响,从而可以通过跟违约用户的关联情况来帮助更好地识别不良中介,通过跟不良中介的关联情况来更好地预测可能出现的违约。

图算法能够刻画申请人群中的各种高危特征(如批量攻击、中介参与等),而可视化工具则可以将各种作案真实情景再现。通过图算法自动产生离线标签,可以配合在线规则进行欺诈风险实时拦截;借助可视化工具,不断探索欺诈特征从而不断优化图算法的特征刻画精度,能够实现人机闭环的反欺诈产品运营。

图片 4

图片 5

2.怎么实现

超强“反欺诈防护盾”诞生!!!

拍拍贷AI团队技术人员表示,这个框架提供了一个很强大的优势:当大量缺失其中一个预测目标标签数据的时候,可以通过另一个关联的任务对该任务进行增强。由于不良中介的标签往往依赖反欺诈专家进行调查来获取,十分昂贵,而这个框架可以在几乎没有已知不良中介标签的情况下实现对这一隐藏身份的有效识别,并且帮助提升对违约的预测。

目前能够实现图算法的框架有很多,像Google的Pregel、开源的Giraph和基于Spark的GraphX等。这些框架各有优势,有的处理量级大,有的框架稳定,有的时效性好。在实际应用中,需综合考虑几种技术的优劣并结合企业自身情况做出取舍。开源的技术可以快速落地,但无法按照企业自身业务进行定制;自主搭建的框架与企业自身业务更加契合,但需要高端人才的储备和较长的迭代开发周期。值得指出的是,在图算法开发及应用过程中,不必一味追求实时计算,在一定程度上使用离线方式部署可以绕开技术瓶颈、释放计算压力。具体可参见上一期点击查看>>“在线与离线”。

图片 6

据了解,该文工作的有效性在多个实验中得到了验证,并且作为拍拍贷明镜反欺诈系统的重要一环已逐步投入实际业务应用,大大提升了反欺诈的有效性和效率。

3.如何应用

集合百度深度学习平台、图像检索以及通用图像技术能力而提供的人脸识别技术服务,还有多场景、多语种、高精度的整体文字检测识别、身份证识别及银行卡识别服务,磐石不仅拥有丰富的身份识别技术和产品,更是涵盖了风险名单、多头防控分、关联黑产分、信用分、信息置信度、地理位置核验、用户授权认证等多种产品。

创新算法提升复杂网络表示学习质量

反欺诈中有几个常见的应用,一个是“物以类聚人以群分“:如果申请人在好人群组中,他的欺诈风险相对较低;如果申请人在坏人群组中,他的欺诈风险相对较高。图算法可以发现人海之中那些聚集在一起的群组,并结合群体特征,智能识别这些群组中的哪些会是潜在欺诈团伙。

图片 7

此外,由同一团队推出的另一篇论文“A Unified Network Embedding Algorithm for Multi-type Similarity Measures”中的工作也将在CIKM workshop GRLA上进行介绍。

另一个是“近朱者赤近墨者黑“:与好人关系密切的人会偏好,与坏人关系密切的人有变坏的风险。在真实的消费金融场景中,好人和坏人之间往往也存在千丝万缕的联系(如社交关系),可以运用图算法刻画人与人之间的紧密程度或相似程度,并通过标签传播的方式定位混合群组中的好人子群和坏人子群。需要注意的是,在这个过程中,关系类型要进行精细化区分,尽可能保证好人群组和坏人群组的隔离。

“道高一尺,魔高一丈”也在这一系统中得到完美诠释。

据了解,该论文则是关于复杂网络表示学习,即,将庞大的社交关联网中的一个个节点,描述为向量,并且保持原网络在结构、语义、邻近等方面的性质。这个向量化的表示一般是复杂网络存储和查询、建模等下游应用的起点,表示学习的质量直接影响应用,所以受到广泛关注。

最后“射人射马擒贼擒王”,一个头领是整个团体的核心,找到核心可以事半功倍。图算法可智能识别群组中的核心成员,而核心成员在现实业务中往往会扮演黑中介的角色。中介对现金贷场景的危害已广为所知,中介模型的效果也已得到过确凿的验证(如下图)。但需要特别指出的是,中介本人的征信往往将其指向优质人群;毕竟,职业属性并不是判断信用、欺诈属性的唯一标准。

磐石反欺诈在“贷前、贷中、贷后”对无孔不入的欺诈行为进行全方位拦截:

经典方法一般采用网络连通或者结构相似来作为节点相似的度量标准,而对不满足这种相似度量的数据和应用场景则效果不佳。比如逾期用户节点往往具有连通相似的特性,而不良中介往往具有结构相似的特性。

图片 8

图片 9

拍拍贷研究人员表示,在这篇文章中,提出了一个统一的算法框架,可以灵活学习不同相似度量的重要程度,从而可以方便使用同一套算法来应对不同的下游应用,对业务工程实践很友好。

总结

超能力释放:一位用户在某互联网金融借贷平台上申请2万元小额贷款,平台通过磐石反欺诈多头查询接口输入该用户信息,发现该用户近7天内在8家互联网金融公司申请了现金贷款;另一位学生向某教育信贷机构申请分期贷款,该机构通过磐石关联黑产接口对用户资质进行审核,发现该用户与多达15个风险名单恶意逾期用户、骗贷团伙关联密切。

作为头部金融科技平台,拍拍贷相关研究人员均来自海内外顶级高校和知名科技企业,并拥有来自加州理工大学、加州大学洛杉矶分校、浙江大学等高校的多名教授作为科学顾问,长期保持积极的合作。本次CIKM介绍的2篇论文也展示了几方良好合作的阶段性成果。

图算法的应用是一个不断探索和优化的过程。怀着对数据的敬畏之心不断净化网络信息,并怀着对风险的敬畏之心不断探索欺诈特征,是图算法在反欺诈策略中应用的重中之重。

细观磐石反欺诈众多的产品能力,网络黑产会在磐石设备风控应用流程的作用下被拒之门外,开启“红灯”模式,只有合法合规的信息才会被“放行”。

目前,拍拍贷自研技术已实现业务流程的全覆盖,如人脸识别、多场景OCR、声纹识别等多模态核身技术,语音识别、意图识别、语义理解等全流程智能对话机器人技术,基于复杂网络的不良中介识别和团伙识别技术等。未来,拍拍贷还将在智能投放、精准营销、核身、反欺诈和智能客服等金融场景推出更多的应用和研究成果。

聚类算法在很多场合被提及,有的基于距离,有的基于密度。下期我们将聚焦聚类算法在反欺诈中的应用。

图片 10

如有转载或合作需求,欢迎联系我们

针对无孔不入的网络黑产,设备风控能力还设置了“矩阵”式场景识别,对其进行全方位拦截。比如细致到“模拟器、盗号、薅羊毛”……

邮箱:wuxiaolan@zhongan.io

图片 11

微信:1084569292

“活体识别”能力在反欺诈能力中是最直观的存在,百度磐石“活体识别”,可以快速对人脸72个关键点进行精准“画像”,即使在模糊的环境中也丝毫不影响这一功能。我们在日常生活中也或多或少体验过人脸识别,活体识别流程究竟如何?

其实,设备会首先检查照片中是否有人脸,保证人脸没有消失,通过做动作可以保证我们是真实存在的而不是照片,同时还要保证不是GIF、视频等这类攻击手段,随后需要拿照片和公安网图像对比, 确保是同一人,才可以进行相似度打分。在如此复杂的识别过程中,磐石“活体识别”能力5s内就可以完成验证,更有超过90%的几率可以实现秒级验证。

图片 12

更引起我们关注的是,欺诈行为现在已经呈现团伙作案的特点。其实,为了满足不同企业在贷前风险识别、贷中实时监控以及贷后失踪复联的差异化需求,依靠产品架构及图形化黑产关联建设技术,磐石反欺诈主要向金融机构输出黑产关联分,帮助金融机构有效识别团伙欺诈、黑中介。

图片 13

说到底,在黑产泛滥的今天,欺诈团伙的手段不断更新,所以只有依靠大数据与人工智能的“火眼金睛”,才能有效打击黑产犯罪。

磐石说:

你们的心愿是:世界和平!

我的心愿是:让金融的世界更安全!

本文由十大网赌网址发布于世界历史,转载请注明出处:图算法如何刻画申请人群中的高危特征,拍拍贷

关键词:

上一篇:习近平和彭丽媛设宴欢迎出席第二届中国国际进

下一篇:没有了