客服: 010-56027552 技术: 010-59410679
客服QQ: 2853966356 技术QQ: 719750959
联系我们
北京鸿利恒计算机服务有限责任公司
客服: 010-56027552
技术: 010-59410679
邮箱: hlhjsj@foxmail.com
关注公众号
添加微信

突破技术壁垒 人工智能为银行反欺诈提供新思路

发布:2017-10-25 来源: 北京鸿利恒计算机服务有限责任公司

欺诈风险是国内金融领域面临的最大挑战之一,大部分金融机构长期受欺诈影响。全球领先的风险管理咨询公司Kroll发布的《 2016/17年度全球反欺诈及风险报告》指出,欺诈造成的受欺诈损失占营业额0.5%至3%之间不等(已核实的部分),并且随着欺诈手段日趋多元化,这一占比在逐年上升。因此,反欺诈已被金融机构和监管部门视为重要议题。

高维度机器学习模型:反欺诈方案的“内核”

以往,银行在侦测信用卡线下欺诈交易方面通常会采用专家规则的方式,即行内人员通过对欺诈案例的欺诈主体、手段等进行分析和总结,形成专家规则。这种规则的有效性是毋庸置疑的,但是同时也存在一些不足:首先,专家规则是由人来制定的,但人的思维往往是采用“抓大放小”的方式,因而其难以覆盖长尾的交易欺诈场景;其次,欺诈手段日趋多元化,但人很难快速准确地掌握新型欺诈手段的特征与规则,以应对欺诈行为的持续变化。诸多因素导致专家规则目前在罕见的、新的欺诈案件上有所局限。而通过机器学习技术,可以大幅提升这些欺诈案件的侦测率。

第四范式基于”机器学习“的反欺诈解决方案,是通过从交易报文、用户、卡片等信息、训练出一个高维度模型,从而找出一些很难被专家规则发现的特征,这恰恰是机器所擅长的。

在数据预处理环节,第四范式的反欺诈解决方案采用了全量样本进行数据建模。在特征工程阶段,机器学习和专家规则一样,首先需要抽取交易报文、用户信息、卡人卡片档等基本信息,之后再结合其他已有数据,在符合业务逻辑的情况下,通过将交易报文中的原始字段进行超高维组合、衍生。最终,对比于总数在千条之内的专家规则,第四范式设计的大数据机器学习模型的反欺诈特征体系,在总量超过25亿维的特征集上进行探索,最终发现有效特征8000万维,如此高维的规则是很难被不法分子攻破的。

此外,机器学习对于出现概率低的“非典型特征”以及不断更新中的特征,都有着超强的识别、总结能力。交易欺诈从数据上看实际上是一些模式(pattern)的变化,如果是非典型的欺诈手段,较难被专家规则命中,但机器学习的模型可能捕捉到这些异常模式(pattern)。具体来说,某次交易会同时命中多条弱模式(pattern),从而识别出该笔为欺诈交易。除此之外,即使欺诈手段发生彻底的变化,机器学习可以从案例中不断自主更新学习,以适应新的欺诈手段。

第三代实时反欺诈架构:反欺诈方案的“载体”

拥有出色的模型之后,如何将它应用在反欺诈体系中成为了另一道难题。模型越出色,则意味着对系统架构的要求约苛刻。

首先,在延迟方面,每笔信用卡交易的时长基本上在一百毫秒以内,换句话来说,实现对欺诈交易的阻拦全过程要控制在毫秒级,因此留给模型判断的时间非常短暂。如果处理过慢计算结果就会被丢弃,间接影响反欺诈效果。其次是稳定性。稳定性是指两个方面,其一是系统的高可用性,反欺诈系统必须保证较高的服务可用率。其二是系统的响应稳定性,比如在所有交易请求中,99%的交易响应时间需要控制在一定的范围内(P99)。最后是如何支持机器学习对高位特征计算以及预估的需求。

此前,银行共出现了两代实时反欺诈架构。第一代的实时反欺诈架构虽实现了对当前交易进行欺诈识别需求,但是无法满足专家规则对交易历史数据需求,且流式计算引擎运行较为复杂,难以保证在限定的时间内完成所有规则的计算。