cnBeta.COM_中文业界资讯站

详解快牛金科“黑科技”:大数据风控助力金融服务

2018-05-17 来源: 中关村网 作者:lisa 次阅读

详解快牛金科“黑科技”:大数据风控助力金融服务

  “在互联网上,没有人知道你是一条狗”,这句诞生自1993年的互联网古早名言,放在如今逐渐实现全面线上化的金融服务上依然适用——在流量背后,没人知道你是“好人”还是“黑产”。

  快牛金科了解到公安部2015年参与发布的一组数据显示,网络黑产直接从业者已经超过40万人,上下游人员160万人,年产值达到1100亿元,而令人讽刺的是,网络安全产业的全部产值不到300亿。

  和金融相关的“黑产”渗透于支付、借贷、消费等多个环节,快牛金科从风险角度来看,金融行业需要防范的东西一直未变,身份欺诈、不适当授信,以及不当授信带来的还款压力等。随着时代的进步和技术的发展,欺诈与反欺诈的博弈战场从线下走到线上,风控面临着更大的挑战,快牛金科认为不断更新换代的新技术,也带来了更有效的风险防范手段。

  魔高一尺,道高一丈


图片关键词 
快牛金科首席风控官 郭曦

  “风控的第一步,其实还是确认三大哲学终极命题中的‘你是谁?’”郭曦说道。快牛金科CRO,曾先后服务于支付宝、芝麻信用和菜鸟供应链金融团队,拥有10余年零售金融与互联网大数据挖掘经验的郭曦,在谈论起风控时,他的口头禅依然是:风控真的很有意思。

  快牛金科由出身BAT类IT科技公司、大型律师事务所和权威金融机构前高管共同创办,是一家以人工智能技术和大数据建模为核心的综合金融科技集团企业,主要面向未被央行征信所覆盖的年轻人群体,快牛金科通过挖掘数据特征定位客户需求,为用户进行精准、便捷的个人授信。

  “互联网上的授信决策让虚拟环境下的身份识别非常关键,常见的人脸识别技术就派上用场。但是‘黑产’也在不断进化,比如把我们系统中失败的人脸认证调出来一看,进行欺骗攻击的有PS高清照、播放预制视频等,高级的还有3D人脸模型,让它摇头动嘴都能做到。所以说,与‘黑产’斗,其乐无穷。”

  针对这些攻击,据郭曦介绍,快牛金科运用光线活体这一新技术——将不同颜色和强度的光线投射到面部,经摄像头接收后,运用一系列算法处理和卷积神经网络,分析推导人脸信息。光线活体技术建立在密码学的坚实基础之上,是目前已知安全级别最高的技术之一。

  快牛金科认为相比虚假身份的识别,组团欺诈的发现难度更大。一般来说,团体欺诈往往隐藏在非常复杂的关系网络里,很难识别。只有把其中隐含的关系网络梳理清楚,才有可能去分析出其中潜在的风险。知识图谱,因为天生用来描述关系网络,因而具备了分析组团欺诈的便捷手段。

  简单来说,用户的每个数据都可以作为一个节点,数据节点之间产生联系后就产生了边,这些节点与边构成了庞大的数据量。将这些信息进行整合,并构建已知的主要欺诈要素(如手机、设备、账号和地域等)的关系图谱,便可全方位了解借款人风险数据的统计分析,对潜在的欺诈行为作出及时的反应。

  拥有底层数据源的BAT都建立了基于关系图谱计算的引擎和数据库,用于监测用户风险的传播。而快牛金科和腾讯合作的“星图”产品,通过引入知识图谱技术,可以在开源或常见数据库中,插入新用户的数据节点,从而进行用户的风险查询。和以往产品相比,星图中数据节点的插入速度和用户结果的查询效率都大大提高。

  除了发现新用户的数据造假、历史违约、组团欺诈外,快牛金科应用的关系图谱技术在监测老用户的风险聚集上也起到了至关重要的作用。

  快牛金科:数据决定模型准确率的上限

  “你有多少数据,就决定了你能够做得多好,所有的策略和算法都在无限逼近那个‘可能的上限’,那个‘天花板’就是由数据决定。”在郭曦看来,快牛金科最大的优势就在于其数据的“深”与“广”。作为多家顶级机构的联合建模实验室成员,快牛金科拥有丰富多元的数据来源,涵盖了用户交易、出行、社交、资产等线上线下的2000多个维度的海量数据,使得全面刻画一个用户的风险画像成为可能。

 图片关键词

  但互联网上的数据大多为弱相关性数据,深入研究这些数据成为必修课。快牛金科与BATJ及一些大型数据供应商进行深度合作,直接在这些底层数据源中建立定制化的策略和模型,从弱相关数据提取强相关性的变量,再总结出强相关性的评分模型,最后在快牛金科做进一步的加工。在快牛金科自主研发的元方智能云风控系统上,风险模型的KS值已经达到0.45以上。

  数据的“广”和“深”,让快牛金科的模型表现出优秀的风险区分能力,尤其是在小额借贷、小额分期上。

  “经历过早期信用风险模型建立的人都知道,专家模型的KS值很低。而随着多元数据源的不断收集、AI算法的持续升级,特别是深度学习的出现,让现在的大数据模型能对用户风险进行精准的量化评估。”郭曦解释了元方风控系统模型0.45的KS值的概念:“在我们拒绝20%‘好’用户的时候,65%的违约或欺诈用户也会被‘拦在门外’。”在互联网风控实践中,这无疑是一个极为有效的模型。

  郭曦就职于蚂蚁金服期间,就曾负责海量用户数据下的交易与信用风险相关的机器学习模型开发与应用策略,主导了千亿级团伙网络欺诈识别模型。对他而言,在快牛金科的风控模型中,根据模型的有效性、准确性、覆盖率和波动性对其进行合理迭代提出了更为具体的要求。

  不仅如此,在多维刻画用户画像、精准量化用户风险的基础上,保证良好的用户体验也对郭曦和他的团队提出了挑战。

  “信用审核中,争分夺秒是必须的,用户往往缺乏耐心。此时,风控系统的实时计算能力就成为一个考验。”郭曦解释道。互联网金融的获客成本水涨船高,每多等1分钟,用户的流失都是不可估量的损失。面对复杂多样的用户数据,需要强大的实时数据梳理和加工能力将其加工成各种特征维度,才能提炼出用户特征对其进行风险评判。构建实时风控计算能力是快牛金科整个风控系统中重要的一环。快牛金科目前可以实现新用户3分钟内、老用户1分钟内的风险评估和算法决策。

  金融科技行业的发展让技术降低了金融服务的门槛,服务渠道的下沉、平台的互联网化、金融产品的小额高频化,都对风控提出了更现代化和个性化的要求。在这个过程中,风控是眺望者,也是守门员。基于科技能力实现对传统风控流程的革新,将风险前置,全面提升业务风控能力成为金融科技企业持续经营的重点。

  对于以快牛金科CRO郭曦为代表的风控从业者来说,数据是有趣的、风控是充满挑战的,如何更好地利用大数据技术服务金融、服务用户将是他们未来持续探索的方向。