语言切换
媒体中心 News

百度金融风险资产管理部总经理房佳珮:AI时代如何做催收?

日期: 2017-11-15
浏览次数: 135
分享到:

从2016年起,中国整体经济下行压力仍较大,经济发展进入新常态,随着"三去一降一补"战略的深入推进,经济结构调整取得一定成效,国民经济持续平稳发展。受国际国内经济金融形势的影响,中国贷后处置行业出现了新的变化和特点。 

此外,由于互联网金融、消费金融等新型金融模式的快速发展,导致相关风险不断积累。据专家分析,2017年下半年由于政策不断收紧及可客群不断下沉,贷款质量会进一步恶化,贷后处置市场将迎来爆发式的增长。 

基于此,零壹财经和览雨信息于11月9、10日联合举办中国贷后风险管理及资产处置峰会。本次会议意在整合贷后处置相关的各方机构,为行业搭建合作沟通平台,探索贷后处置的新模式,包括贷后处置市场及政策解读、金融科技及大数据对于不良资产处置的助力、不良资产包定价及交易、细分领域(汽车金融、融资租赁、小微企业贷、信用贷)贷后处置模式、行业投资机会等。 

此次论坛邀请百度金融风险资产管理部总经理房佳珮出席,她结合案例详细介绍了百度金融在AI时代催收的具体做法。 

附演讲原文: 

房佳珮:各位上午好!一个月前接到协会邀请,来参加这样分享大会,我想借这个机会见见老朋友,就抱这样心态今天跟大家聊一聊百度金融在催收AI时代具体的做法。 

首先百度本身还是一家以人工智能、AI技术为主要的驱动公司,所以大数据现在鱼龙混杂,号称做大数据公司很多,我们不讲大数据,我们就讲百度数据大,目前百度基于数据大基础上,我们在全世界上其实有多个研发中心进行这部分数据挖掘和清洗,以及它实际落地。其实对于数据大了之后人工智能的应用,金融、无人驾驶和医疗其实是它最大的三个落地场景,百度金融就承担AI在金融方面实际落地。 

这里就跟大家展示百度金融内部AI技术引擎,我们叫磐石的科技系统,这套系统从客户申请端开始的身份验证、欺诈的排除、虚假资料的核实、以及信用评估到最后风险策略的安排,都在这套系统做了前后贯通风险管理。大家都是互联网金融或者金融互联网公司,在这个基础上技术大同小异,包括身份识别的活体识别、OCR文字识别主要识别身份证,另外反欺诈的风险名单,以及应对黑产的多头防控,以及关联黑产的防身。因为百度有地理位置核验,经过用户授权认证情况下我们提取他运营商、公积金、学历第三方数据,通过数据整合做信息置信度建模和分析,形成一定的风险评分。我们其实有福尔摩斯内神经的关联技术,包括正常客户和逾期客户在很多场景和应用当中都会留下痕迹,但是这些痕迹很多情况下是散落、离散的状态,通过这样系统我们把海淘数据做到整合和归类使用。 

这是数据大的体现,每天有超过百亿搜索行为,包括百亿的金融用户画像。在反欺诈方面,包括贷前风险识别,贷中监控变动、贷后对用户恶意形成实时监控。从输入和输出来看,我们三项实名验证,姓名、手机、身份证输入磐石模型之后,输出一个风险名单、多头防控、关联黑产评分,很大程度上剔除高风险和黑产客户对我们的攻击。上个月输入和输出项对每个客户都会打一个标签,这是风险等级的输入和输出,基本上输出结果作为审批的评分。 

这里重点说一下IBS信息在贷中、贷前、贷后应用,因为百度本身有地图,BAT很多家都有这方面应用,实际上在金融应用来看还是很难使用,包括他每天我知道早上八点到晚上六点都在这个区域行动轨迹,如果一到五都这样,其实这个地址很可能他公司工作地址,晚上九点以后到第二天六点之前轨迹可能个人居住地址,同样我们会把地址信息、地图获取的地址信息跟他申请时填的公司和居住地比对,从比对结果来看,包括人户分离的情况,大致来看如果他地理位置和实际填写的,我们有评分0-300之间,分越高未来逾期率越高,稳定性和真实性都存在问题。同样这一块信息用在贷后催收过程,包括失联客户定位、以及外访之前对客户地理精度,都能够做前置工作。目前定位信息准确度已经达到85%。 

另外我们会对他输入地址验证和访问频次和时长做信息验证,这部分数据,百度还是比较公开的平台式业务架构,这部分数据可以对接和输出的。同时我们在搜索到客户居住地址之后,除了一部分租户情况,大部分自有客户,我们对他财力、住小区的价格、目前财力都有估算,对于估算客户偿还能力和经济水平这部分信息还是有用的。这里把刚才讲到信息做一个置信度最后结合的评分,根据置信度确定这个客户申请是否真实有效。 

最后就形成磐石信用分作为审核阶段的依据,这里说一下,百度内部其实对客户会做实时画像的标签,包括审核阶段和最后审批完之后实际应用和贷后阶段,因为客户还是多变的,可能他的个人状况、财力状况都会有实时变化,所以我们评分随着他在百度各款APP或者各项应用中变化而做实时更新,百度通用的客户画像就是刚才讲的近6.8亿客户,我们一级标签和金融专署标签还是不同,我们在金融这个阶段读取他纯金融属性信息三千多,落实到合适的产品、合适的价格、合适的销售对象。这是我们内部人群的区分,虽然不像芝麻信用芝麻分目前输出和应用场景比较广泛,但是百度内部也是一套评分规则,这套规则没有公开客户本人读取,但是内部每个人都有分值,随着你各项应用中表现。 

这里就是我们福尔摩斯体系,这个体系刚才听快催收也讲到,他会把客户包括手机设备信息、手机卡信息、身份账户和外部信息做一个留存,但是留存之后怎么关联起来投入到应用阶段还是很大的难题,比如说我们在抓黑产过程当中,大家可以看到这是真实的案例,我们抓了河南黑产机构,一次性打击八名黑产套现客户,左边是当时三项验证人脸识别照片,右边是身份证照片,因为河南本身也很大,所以怎样在海量数据中挖掘这些人关联性,第一读取几个人设备,当时几个人设备没有读取,但是逾期表现很异常,我们后来通过图象比对技术,左边人脸识别照片、背景图片很相似,背景图片相似度很高,最后通过这样方式包括他的身份证号、手机号归属地抓取八名团伙客户,目前客户止损报案状态,更大背后堵更多的黑产客户的攻击。 

昨天下午有关于不良资产ABS估价问题,百度金融有几块业务,其中一块消费信贷自营业务,同时我们也算ABS,ABS两方面,一方面把百度消费信贷资产通过ABS转让其他机构,同时今年到目前为止也收100多亿消费信贷的资产,通过百度自有平台做ABS发放,我们也会自取一部分。在讲到ABS资产估价和价值判断的时候,我觉得防黑产这个事情还是很重要。如果纯粹信用逾期客户他本身,这是我们拿出福尔摩斯客户端正常交易机构贷款类型,左边图有颜色,发生不同逾期客户的表现,但是一旦发生团伙欺诈、机构内外勾结、内外欺诈之后,它的逾期表现不是均匀和散落式,有团伙欺诈集中表现集中某一块区域大面积爆发,这些人都是也相互关联性,如果贷前、贷中没有堵住,关联性爆发是非常严重和大面积的,如果机构内外勾结包括操作性风险,局部一小撮风险就很大。我觉得对于ABS业务估价还是有非常强的反欺诈能力,如果这个机构在贷前裸奔状态,贷后尤其收资产的时候,这部分客户建议跑反欺诈模型,判断有多少欺诈风险、多少信用风险,对于信用风险价格没有意义。 

最后讲一下我们内部基于磐石作业系统,从前端获客开始、到贷中复查、贷后处置整体作业流程,我分享百度金融贷后的特点,有些基于百度内部数据优势会有先天的优势,有些同业之间可以做交流和分享的,目前百度其实整体催收当中,当然做不到美国这么先进的,基本没有人介入这个状态,但是百度本身自动化催收比例达到50%,尤其目前语音识别很强,台下都是做催收外包行业的,剩下50%大家有充分信心,当然技术不断提升,他们基本作业原理把客户语音转化成文字,文字再对应百度催收库提取关键字,关键字再转送成客户,他语音语调对客户判断还是有差距,尤其中文博大精深的语言种类,如果客户说我很愿意还款,真的来还,还是有意愿没有能力,还是意愿是假的,对同样一种语言真实意思的判断机器做不到,还需要人的真实交流判断下步动作。因为它不是标准化作业,所以这一块各家催收公司需要大量人力存在的理由。 

另外催收复联的理由,随着科技提升已经到很高的层次,基于信息安全保护、包括国家监管政策和要求,没有办法批量铺开和运用,这也是协会和行业、以及立法需要推动一件事情,这样信息发达情况下找人真的不困难。比如我今天跟董总在酒店来开会,我们介入同样WIFI,甚至不用介入,我跟他有过握手,今天一整天我们都在一起,同时我有董总两个人背后联系方式,基本确定我们两个人进行一天交流或者亲密联系的。要找到客户真的不难,但是法律法规和目前实际的应用落地可能比较大的障碍,但是百度复联技术提供所有内催团队和百度所有合作的厂商,这个系统在我们内部催收平台使用拿不出去,所有逾期客户都会透过背后信息修复,帮助他找到合适的催收第三人或者客户本人,今天分享这些,希望给大家有抛砖引玉的作用,谢谢! 


文章来源:零壹财经 

地址:江苏省昆山市花桥经济开发区金华路2号华道产业园
电话:+86 0755-2955 6666
传真:+86 0755-2788 8009
邮编:330520
Copyright ©2005 - 2015 华道数据处理(苏州)有限公司 ALL RIGHTS RESERVED
犀牛云提供云计算服务