【695期】刘德彬:互联网金融时代 大数据尽显英雄本色
刘德彬——杭州誉存科技有限公司创始人。毕业于中国科学技术大学近代物理系,美国德克萨斯A&M大学物理系硕士,美国印第安纳大学信息学博士。作为美国第一批信息学博士,其开创了基于用户行为、分析用户动机,进而量化风险、管理和控制信息风险的新研究领域。曾任同盾科技首席科学家、PayPal资深数据科学家和美国联邦储备银行的访问学者。多项技术成果获得美国CSO40创新大奖。申报发明专利与软件著作权多项。两年前带领团队创业,独立研发的橙信大数据企业监控系统针对银行和信贷机构设计,实现了企业数据收集、可视化和深度挖掘,给予客户优质的一站式风控体验。 对于大数据在互联网金融风险监控中的应用。这里将阐述三个关键词:大数据、互联网金融、风险监控。 在喜新厌旧的技术初创企业界,已有 3 年历史 “大数据” 听起来似乎已经过气了。虽然 Hadoop 在 2006 年 已经出来,但 “大数据” 这个概念大概是在 2011 到 2014 年左右才真正火起来的。大数据有趣的一点在于,它不再像当初经历过那样有可能成为炒作的题材了。但是,对于大数据而言依旧拥有他自己的价值所在。 1. 理解客户需求 作为大数据的应用目前在这领域是最广为人知的。重点是如何应用大数据更好的了解客户以及基本信息、风险信息、关联信息、资产公示信息、行业信息、上市信息、评估反馈等关键信息。 2.优化业务流程 可以通过利用社交媒体数据、网络搜索挖掘出有价值的数据,提供切实的评估反馈。 3.金融交易 大数据在金融行业主要是应用金融交易。高频交易(HFT)是大数据应用比较多的领域。其中大数据算法应用于交易决定。 4、贸易解决方案 互联网时代,发达咨询能够为贸易公司开发新合作伙伴提供便利,但互联网信息的碎片化特性使得信息收集和整理的行为成本高昂。大数据的应用可以有效的搜集这些碎片化的数据信息,降低成本。 5、改善安全性能 大数据现在已经广泛应用到安全执法的过程当中。企业则应用大数据技术进行防御网络攻击。同时信用卡公司也可以应用大数据工具来槛车欺诈性交易。 6、提高城市便利 大数据还被应用改善我们日常生活的城市。例如基于城市实时交通信息、利用社交网络和天气数据来优化最新的交通情况。目前很多城市都在进行大数据的分析和试点。 就现阶段中国经济情况来看,经济主力人口严重不足、传统工业的突然结束、制造业的自保自足以及消费的外流、资金外流等元素导致了现阶段中国经济下行。法国兴业银行和恒生银行认为,直到2020年,才会出现经济重新加速。法兴银行中国经济学家姚伟预测,中国经济到2019年将会下滑到5%。 在传统经济如此不景气的情况下,曾经被赋予重望的P2P也由于诸多原因导致了P2P金融神话的破灭。去年,央行进行了五次降息、降准,挽救P2P行业劣势。但根据网贷之家和第一网贷发布的月报显示,P2P收益率持续下行,再创新低。 P2P就是点对点信贷,通常分为传统线下的P2P金融和基于电子商务的P2P网贷平台。本文讨论的均为P2P网贷。虽然在我国,P2P还是一个新兴名词,但早在上世纪八十年代在孟加拉国就有了基本雏形,后来2005年美国PROSPER将雏形进一步提炼和创新,创办了PROSPER网络小额贷款平台,让资金富余者通过PROSPER向需要借款的人提供贷款,并收取一定利息。 在中国,小微企业的融资需求始终无法从银行等间接融资渠道中得到满足,这也为国内P2P金融平台发展提供了空间。可是,在我国互联网金融发展时间短、监控尚不成熟的情况下,P2P平台累计暴雷跑路高达1488家。我国P2P平台总数3964家,暴雷率高达37.5% 。 由于一般投资者并不能对平台做出及时、有效的风险监控预警,使得类似的暴雷跑路问题越来越多。同时由于P2P的互联网属性,投资者维权、追讨过程比较繁杂,成本也较高,立案并侦破的案件很少,多数投资者血本无归。 在行业风险不断积累的情况下,监管却处于缺位状态。《关于促进互联网金融健康发展的指导意见》从框架上对P2P的行业定位、监管方向及分工等进行了规定。但相关的准入标准、机构属性、运作规范等监管细则迟迟没有落地,行业仍处于监管的真空地带。在前无严格准入、后无监管约束的状况下,仅仅依靠老百姓擦亮眼睛去识别错综复杂的金融风险是不现实的。 另一方面,在今天的金融界,尤其是经济下行的期间,越来越多的人认识到,风险是可以传导的。造成P2P跑路的原因也是多种多样的。有很多业内人士很完整的总结过各种跑路的原因和风险问题。而对于风险,监管部门并非什么都没做。传统的金融机构和互联网金融平台们都有一套各自的监管系统。但这些监管方式都或多或少的存在主观性:风险评估会因人而异;负责人又存在责任心、道德风险的问题;每个人的经验、能力、甚至是风险偏好都不一样等等。 举个例子:西部本土某大型P2P平台(以下称西部某平台),在去年底被指其平台上的产品到期无法兑付而这些无法兑付的产品均由北方某担保集团(以下称北方担保)通过西部某平台进行发售,共12期,年化率9%,涉及金额超5000万元。实际上,北方担保早在2015年年中就已经破产,企业被托管。后来经过不断演变和发展,最终爆出西部某平台上的北方担保全部产品违约,系统性风险全面爆发。本次事件涉及多地近1000多位投资人。为什么该平台会出现这样的危机,难道没有专业的风控人员吗?并不是! 在这个事件中会发现这样的现象: (1)风险的出现,不会是瞬间出现的,而是有个期间,问题是慢慢浮现的。 (2)从钱贷出到回款,企业经营性贷款往往存在两到三年的回款周期。换句话说,该平台的风控人员需要靠人去做两到三年的贷中风险监管。所以该平台的这次“金融风暴”究其原因是因为:风险监管不到位,导致了信用风险的传导,最后使得大量投资人受到了严重的损失。 事实上,将大数据技术应用在金融风险监控层面是能够为金融机构,特别是P2P这种高风险的金融平台解决一些问题的。 首先,从海量的、杂乱的、碎片化的各种信息中,抓取到目标平台的各种数据,将这些数据进行清洗加工后,能够转化为非常有价值的风险信号。这样不但解决了传统风控人员收集信息的难点,而且还规避了人工分析存在主观化的弊端,同时其工作效率与人工搜集不可同日而语。 而面对一些中小型企业的特性即:互联网信息公开化程度低,碎片化信息非常有限等特性。会存在挖掘局限性问题。有很多人认为,如果不结合内部数据,其实很难对其进行有效的预测。但是如果持续的观察,即使是外部公开数据也能够形成一条时间序列的行为变化,并且通过大量的行业分析就能告诉事情出现风险,这个价值就非常大了。 其次,通过对目标的长期监控和系统性的捕捉目标行为,还能够对它的发展和变化进行基于行为和动机的建模分析。其实核心思想就是异常检测(anomaly detection),异常就是风险信号。通过对风险信号的监控,从而预测和防范风险。 第一点是关于抓取数据提高信息收集效率。这一点已经被越来越多的金融机构和个人所接受,也有越来越多的大数据公司在提供类似的服务。 第二点,对目标行为的变化做分析,经常有这样的一种情况:一个刚诞生不久的P2P平台会隔三差五的举行各种活动,公告,媒体宣传,促销活动等等。等过一段时间,这些活动就越来越少了,可能隔几个星期才搞一次。再等一段时间,这些活动可能就是隔几个月才想起来搞一次。最后可能整个平台整个网站就趋于平静,再无波澜,没有营销也没有宣传,甚至连基本的网站维护都消失了。光是这样的一个“平台活跃度”的行为变化和相关的时序分析,就可以带给我们非常有意义的风险信号。(顺便再多说一句,如果刚才那个平台突然有一天从平静中又喧嚣起来,嚷化率的秒标,那它基本可以确定是准备跑路了。) 最后,互联网金融和传统的金融机构,都能够应用大数据技术去改善风险监控和管理的传统方式,从而提高风控的效率和能力。相信在未来,我国的互联网金融定会在大数据技术支持下,越来越繁荣! 中小微企业在互联网或公开信息中的碎片化信息其实非常有限,如果不结合内部数据,深挖也有局限性。能否举几个更深入点的,不是一两句简单规则的应用例子。 刘德彬:的确,互联网上公开的信息很有限,只是看一次的话,可能意义也不太大。但是如果持续的观察,即使是外部公开数据也能够形成一条时间序列的行为变化。简单规则是基于对这些行为变化的理解和分析上总结出来的。核心思想就是异常检测(anomaly detection),异常就是风险信号。 能否介绍一下你们的数据风控模型和数据采集方式? 刘德彬 :因为没有内部数据,我们的确没办法知道问题具体是什么。但是外部数据和行为分析能够告诉我们事情出问题了有风险了,这个价值我认为已经很大了。阿里音乐流行趋势数据分析大赛是誉存团队三个小伙伴在业余时间参加的比赛。我很同意他们的说法:“比赛过程用到的技术与做其他数据分析的方法和方式基本是一样的,大部分时间用在对数据的理解以及特征的提取上,然后不断迭代机器学习算法以及对结果进行评估。” 誉存科技目前是否有具体的产品和服务? 刘德彬:我们是在这个思路上在创业,有自己开发的产品和服务。
(数据来源于第一网贷网,2016.7.1上半年全国P2P网贷行业年度报告)