(图片来源)
央行新版个人征信报告目前已经投入查询试运行阶段,并将于今年5月进行正式切换。据悉,新版个人征信报告长达15页, 除了将还款记录保留期限从2年拉长到5年、新增还款金额和非信贷交易信息明细等变化以外,此次个人征信报告也首次将防欺诈纳入其中,新增了防欺诈警示,目的是为了防止个人信息被人盗用,方便授信机构掌控个人的动态真实征信情况。
众所周知,在刚过去的2018年,互金领域的暴雷潮使得行业陷入前所未有的信用危机,今年的政府工作报告也因此反复金融风险的防范,强调建立结构性的监管框架,梳理、化解跨业态的各类金融风险和更加高效、透明、有序的行业运行秩序。
而在各类金融风险中,金融欺诈的形势变得越发严峻。一方面因为金融欺诈涉及的业务环节较多、手段多样、隐蔽性强,中国银行业协会就在其《中国银行业产业发展蓝皮书》中列举了多种形态的金融欺诈手段:
账户注册:伪造身份注册、冒用他人身份注册、伪造身份注册;
账户登录:账户盗用与冒用、账户异常共享等;
贷款申请:提供虚假申请信息、同时向多个金融平台申请超过自身偿还能力的贷款;
贷中管理:恶意拖欠;
支付:利用非法获得的信用卡交易;
……
另一方面,金融欺诈的移动化程度不断增加 ,也呈现出组织化、产业链化的特征。据了解,数十亿对账号密码关系为地下黑色产业链所掌握,通过撞库、刷库造成的账号被盗,占到整体被盗账号的80%,而盗号所衍生的黑产业链年获利超百亿元。据《电子商务生态安全白皮书》,中国“网络黑产”从业人员已超过150万,市场规模高达千亿级别。
抵御金融欺诈的难度日渐提高,基于线性模型的传统风控也很难关联关系对风险的影响,精细化、专业化的反欺诈能力因此成为越来越多金融机构和互金公司着重考量的技术能力之一,一批专注反欺诈的企业也应运而生。雷锋网注意到,这些玩家已在这一领域有所表现,并各自拥有不同的技术亮点。
市场上现有的风控产品通常采用黑白名单、信誉库、规则系统等传统方法,传统风控模型需要大量的标签进行训练,并以此预测新的样本。但过多的标签就意味着过多的数据搜集,数据更新费时费力,很难对未知欺诈行为有所察觉,成本增加的同时也会增加用户隐私泄露的危险。而无监督的机器学习不需训练数据,可自动挖掘和检测各种已知、未知的欺诈行为,自动产生标签,用于模型检测,自动产生规则,免除耗时的人工规则调试,主要适用于欺诈团伙的检测。
在一些金融场景当中,米乐m6平台的解决方案往往需要把无监督机器学习和有监督机器学习相结合,将无监督输出的群组特征作为有监督机器模型的输入,另外,还可以将无监督模型的聚类理由变成一种业务的规则,部署到客户的规则系统中,去提升检测的效率。
datavisor
总部位于美国的datavisor专注提供在线欺诈和金融犯罪检测服务,其技术核心之一正是无监督学习算法。据雷锋网了解,datavisor以高精度和十亿账户处理规模为欺诈和金融犯罪提供了无监督机器学习(uml)检测的成熟应用,以无监督机器学习引擎为核心,并结合有监督机器学习和全球智能信誉库为关键组件,无需标签和训练数据即可检测欺诈行为,并且能做到提前检测。
无监督学习引擎能同时处理所有事件和账户活动,分析数以亿计的账户行为模式,以检测到恶意帐户之间的可疑连接。而自动规则引擎成功地将人工智能与机器学习的功能与规则引擎的可解释性相结合,借助无监督机器学习引擎的检测结果,自动规则引擎提供了卓越的检测性能,同时显著降低了对规则调整和维护的需求。
全球智能信誉库是datavisor基于ip地址、地理位置定位、电子邮件域名、移动设备类型、操作系统、浏览器代理、电话前缀等做全量分析后,输出的数字信号,可以用来增强规则引擎和机器学习米乐m6平台的解决方案的能力。
慧安金科
反欺诈领域的新晋玩家慧安金科也将半监督主动式机器学习技术作为其主要技术优势,同样只需要少量标签就可以建立模型。具体来说,半监督主动式机器学习技术可以根据少量的历史标签进行特征提取,训练自身模型,进而将标签迁移、扩散至其他没有标签的用户。
当模型预测失准时,风控专家给予模型反馈,让模型重新学习,为互联网、金融机构和信息安全等其他领域提供更准确、更全面、更详实的数据参考,辅助企业做出风控决策。可以在欺诈行为尚未发生之前,在无预知风险类型和特点的前提下,基于用户行为数据进行建模分析,主动识别用户行为和关联的异常,自动响应新的威胁和攻击,实现提前预警和主动防范;并且不使用用户的身份信息等敏感数据,而是基于用户注册、登录、浏览、下单等行为数据进行建模分析。
同盾科技
2013年成立的同盾科技,将目光聚焦在团伙欺诈,通过部署复杂网络来应对这一挑战,自2015年推出以来已进行多次迭代。复杂网络即是针对复杂对象的关联关系进行非线性建模,由节点(实体)和节点之间错综复杂的关系(实体之间关系)构成拓扑网络,当异常关系聚集出现时,即可识别欺诈行为。同盾融合了自身大数据和外部数据,提供实时可视化关联分析,将规则、关系及变量通过关系网络表现,通过更深层信息挖掘和推理,提供动态分析和监测,并应用至实时团伙检测等。
360金融
刚完成上市动作的360金融,旗下技术团队同样采用了复杂关系网络分析作为反欺诈的重要工具。360金融向雷锋网表示,他们已经将关系网络开发提到了最优先级,目前能做到实时计算关系网络,其关系网络有11多亿个关系节点和140多亿的关系边,辅以千万级别的黑名单和白名单作为复杂关系网络分析的基础。此外,360金融也在算法层面引入了无监督机器学习。
猛犸反欺诈
猛犸反欺诈成立于2014年11月,目前关注的则是设备风险和交互行为风险。其中设备风险是后面四层的基础,也为行为分析提供了数据集,贯穿于gartner五层风险结构。其做法是通过设备指纹识别来控制欺诈风险。与其它厂商通过sdk等方式获取用户信息,然后生成设备指纹不同,猛犸是基于通信协议栈分析欺诈行为,能实现app和移动端h5网页间,不同浏览器之间的设备识别。目前,猛犸已积累了超过3亿的设备指纹。
雷锋网小结: 借助移动互联网等多项技术蓬勃发展的新金融,实际正面临着更严峻的考验。这些金融业务交易频繁、实时性强、数据量大、客群下沉,往往更容易受到欺诈组织的攻击;同时这类攻击除了技术以外,还会掩盖联网设备,伪装身份和信用信息。正如datavisor中国区首席战略官郑骏所言,在反欺诈中要拥有高质量的数据和不断更新的技术,将黑名单、设备指纹、规则引擎、有监督机器学习、无监督机器学习等各种技术手段有机结合,并且具备情报侦察的逻辑,只有知道欺诈分子的技术手段、攻击手段,才能更好地、有针对性地进行防范金融欺诈行为。