2015年10月28日21:54 新浪传媒

  10月28日下午蚂蚁邦沙龙十月汇在言几又咖啡厅举行。本次沙龙的主题为“当大数据爱上金融”,新浪战略合作部总经理乔宇主持本次沙龙,多位金融大数据领域的权威、多家财经媒体参加本次闭门沙龙。以下是本次沙龙的内容实录。

  本次沙龙嘉宾:

  五道口金融学院金融大数据研究室总监杨威、我爱卡/信用宝创始人兼CEO涂志云、百融金服副总裁冯宗欣、《清华金融评论》资深编辑陈旸、周知客创始人周勇、信用卡市场资深研究人士董峥、百融金服市场总监张毅、大公信用数据有限公司项目组项目经理吕佳琦

  到场的媒体有:

  财经杂志、财经网、财新杂志、财新网、经济参考报、中国证券网、中国经营报、华夏时报、证券市场红周刊、新华网、中国新闻网、中国网、环球网、新京报、北京青年报、北京晚报、北京日报、京报网、北京晨报、北京商报、英才杂志、新浪财经。

  主持人乔宇借用新浪董事长兼CEO曹国伟先生在内部会上的一句话“未来大数据必将重构商业”拉开本次沙龙序幕。

  大数据在金融信贷领域的应用

  发言嘉宾五道口金融学院金融大数据研究室总监杨威女士有着多年的商业银行和互联网金融企业的从业经验,她所在的金融大数据研究室致力于金融行业大数据应用的产、学、研互动,探索大数据在风险管理、服务效率和创新业务模式等方面的作用。

  大数据是什么?

  第一,大数据给现在的金融业务模式带来新的创新和颠覆。它的价值主要体现在它为行业的发展提供一种决策支持,大数据本身不是落在商业本身,而是落在了商业模式的支撑发展之上。

  第二,各方面来的数据是对客户静态和动态特征的描述和预测。

  第三,自从有了大数据的这个概念,更多强调的是不同类别、不同边界数据之间的碰撞、融合以及拼接。

  大数据在哪里?

  大数据来源非常广泛,电商、互联网、金融、移动终端,都只是大数据来源的一些维度,实际上数据可能是无所不在的。各行各业都有自己原始的内部、外部的数据的积累,包括金融、通信、医疗、零售。

  ①    整个完整的大数据指示体系,并不仅仅起头于大数据,数据采集和数据搜集整个是大数据知识体系的一个起点,至少还包括数据搜集、采集、进行更好的存储和管理,同时涉及到大数据会有差异化的挖掘工具和处理工具。

  ②    数据的整合和分析,更多的是从业务需求的角度出发,而不是就数据论数据的分析。

  ③    大数据并不局限于只是互联网的数据,在线的互联网数据只是整个大数据范畴里面的一个小部分。如果我们只认为它等同于互联网数据,会把大数据这个概念说小了。

  大数据在金融行业里面的一些应用?

  基本上金融行业、零售消费行业,最先建立自己的ERP的系统,记录有关我企业自身信息,比如说采购、库存、交易的情况。

  CRM系统基本上最先用于金融领域、销售零售领域, CRM系统存储的是有关客户的数据和客户和金融机构之间数据。

  再往后,他们的数据应用就突破了自己内部的范畴,除了我自己的企业数据和我的客户数据之外,就触及到客户在其他机构、其他维度上的一些行为。比如传感器数据、社交数据,还有客户自主生成的数据,客户自媒体的信息,发表在社交媒体的评论,都是更多的数据来源。

  大数据在金融领域的一些应用其实范畴是非常广泛的,他可以用于客户管理,用于风险管理,甚至可以用于自己企业内部的人力资源管理。

  我们今天只截取几个关键的维度:

  ①  获客

  大数据的作用是提供一些动态的信息,有关的用户行为特征。基于行为特征的一些预测,可以使得金融机构圈定出更为精准的一些有需求的客群。

  除了这些表面的特征值外,更重要的是隐藏在背后的数据。比如你填申请表时,点“下一步”之前,这一页你停留了多久时间,你是不是保存了之后又回来进行了修改,这些其实对于金融机构都是数据,在后端筛选过程中都能起到非常重要的作用。

  ②  大数据风险管理

  大数据实质是解决风险管理信息不对称的问题,不管是信用风险还是欺诈风险。另外一个维度上,就是在反欺诈维度的应用。关于信用卡交易反欺诈的案例,某张卡在附近的一个小餐馆花9块9买了一块披萨,地点、金额都对,但是被刷卡银行发现是盗刷。原因是,这个客户所有的交易行为,都在进行商旅服务采购,机票,订的都是外地的酒店,从来都不在本地小额刷卡。这些行为其实描画的是一个客户的整体习惯,不在本身的静态特征上面找欺诈的要素,而是通过原来客户行为习惯的描画来找出这样的差异。

  ③  有关存量客户失联的相关情况

  我们如何进行颠覆传统模型的失联修复:第一倡导的就是我们先把自己内部的信息整合起来,比如说金融机构在其他的业务模块上面采集到的客户信息;第二,客户是不是曾经主动打过你的客服电话,他打的电话号码是怎样的,他提供的联系人是如何的。

  当我们真的发现客户找不到的时候内部信息实在无法进行修复的情况下我们才跨到外部去,外部我们仍旧会先从政府机关的基础的、质量非常好的数据库里面找到相关的修复信息。其次,通过专业的机构去搜索有关身份证相关的行为,以及这些网上相关的搜索痕迹。

  ④  大数据安全问题

  在大数据的应用领域,要有相应的基础设施和环境。外部是整个社会对于大数据的基础建设,内部是金融机构本身数据的存储处理。

  我们需要懂得数据的处理和解析的复合型人才。

  开放机制,才能把整个结果运用到流程里面,最终达到的效果才是一种嵌入式的变革,使得大数据的思维能够整个驱动业务的一些发展和前进。

  互联网重构金融 大数据重塑信用

  发言嘉宾涂志云先生是人大经济学博士,美国斯坦福大学统计学硕士,加州大学伯克利分校工商管理硕士。他曾经为三大洲的五家信用局开发了具有行业标准的个人信用管理评分,在中国和美国的个人信贷领域既有理论又有时间。

  中美信用卡数量差异大

  中国的借记卡基本上是美国的2倍以上,2013年,中国有30多亿张借记卡,美国2011年大概只有16亿张。对一个国家来说,信用卡、借记卡的数量应该相当,2011年美国信用卡大概有15亿,但在中国,信用卡只有4亿多。其中6亿网民中有1.5亿人拥有信用卡,持卡的渗透率大约在25%左右。

  过去几年,中国平均每年都有6千万左右的新增信用卡,这也是全世界最大的增幅了。但其实美国90年代,每年已经有6、7万张新增信用卡,那个时候还没有互联网,是非常传统的直复营销的方式。

  建立征信体系成为重中之重

  为什么中国的银行在发展个人信用、个人信贷领域还相对比较保守?原因主要是风险管理的技术比较落后。风险管理的技术,一般来说有信用风险、道德风险、市场风险等几个领域。从信用风险的角度来说,因为我们还没有建立一套比较发达的征信体系,这是大问题。

  征信服务的三要素:数据,相关的分析,以及相关的技术。传统的征信机构,数据是主要基于银行的交易数据,也就是银行过去24个月信用卡贷款的数据,这方面国外的大数据应用是比较多的,加上分析技术是以FICO为代表的评分相关机构做出,FICO是60多年的公司,他们能够以一个分数代表消费者相关的信用记录,中国虽然有机构推出了评分,但原则来讲还不算标准意义的信用评分,更多的是行为的预测,不是对未来信用以及对未来的这种潜在逾期的一个预测。最后加上相关的技术,才是比较完整的相关的征信服务。

  美国大概有十几部保证征信机构的相关法律,以消费者相关利益为主,明确规定什么数据可以采集、什么数据不可以采集、什么数据可以应用。比如美国有两部法律:《公平信用报告法案》、《公平信用机会法案》,明确规定种族、姓名、年龄等这些变量是不允许用在信用贷决策里,一旦发现就会重罚。

  香港有一部个人数据保护法案,但在2003年之前,香港的征信库里面只有负面数据。因此只能通过立法才能规定什么数据可以采集,但目前只有有限的相关的规定,比如征信业管理条例,还有征信机构管理办法,还没有一部真正意义上的法律。

  征信领域挑战大,机会多

  个人征信信用管理有几大挑战和机会,是事实存在的:

  第一,相关的数据怎么能够整合在一起?央行有银行的数据,但是没有P2P的数据,也没有相关的行为社交、电商这一类的大数据。所以怎么把这个数据进行有效的整合,这是一个大挑战。

  第二,这些数据将来怎么开放?这个必须靠市场化的行为,前期获得准备做征信工作的8家公司的数据源,有的在社交领域比较强,有的在电商领域比较强,有的在支付领域比较强,这些数据怎么进行开放和共享,目前还不知道。

  第三,如何利用这些相关的原始数据做出增值服务和一些加工?信用报告的获得是不容易的,信用报告的解读和利用也是不太容易的,只有把信用报告变成中间的变量或者变成评分,才比较有价值,才能够得到使用。所以怎么对信用的数据进行加工,把它做成增值产品,这是个非常大的挑战,也是一个机会。

  第四,使用的问题。假设我们今天有了9到 10家征信公司,假设这些公司都在出信用报告,假设这些公司都在出信用评分,我们的金融机构就会用吗?不一定! 2004年香港推出征信的时候,香港的银行基本上都不会用。所以这类机会也非常大,需要大量的金融和风险管理的人才,投入到数据的采集、集合、开放、加工、使用,中国征信产业才能够发展。

  总的来说,中国极其强大的市场需求和目前比较落后的征信体系的反差,使我们可以利用科技和大数据在征信领域里面做一次真正的创新和变革,逼迫中国在未来10年的时间走完美国过去30年的路。

  大数据助力普惠金融

  发言嘉宾百融金服副总裁 冯宗欣先生。百融金服在做的主要是数据的搜集、数据的整合、数据的加工、数据的应用,现在已经有近300家的金融客户。我们成立了一个反欺诈联盟,有大量的小贷和P2P加入了我们的联盟,所以今年下半年,我们的金融客户群扩充非常快。

  普惠金融或者信贷中有营销、信用、欺诈、定价、催收五大块,我主要围绕信用模块跟大家做个探讨。

  大数据的核心价值在于哪儿?

  第一,数据必须是融合的,不同行业的数据,必须要有一个数据的交叉融合。第二,这个数据必须是流动的,他的热度要非常高。在这两个基础之上我们的大数据才能去挖掘他的核心价值,或者说他才具有挖掘的潜力。

  大数据还有一些外部特征,我们现在讲大数据更强调外部数据,这主要是站在我们金融行业传统企业自身来说,假如我是一家银行,有自己的主体数据,有自己的主体交易数据,他用大数据的时候更应该注重我们大数据外部的应用。传统的商业智能公司或者我们的数据挖掘厂商,更强调内部应用。所以我们现在一直讲,传统的数据实际上是一种信息,信息的累加还是信息,本质没有发生变化。

  随着我们消费一些金融产品,无论是存款、贷款还是保险里面的保险产品、养老、两全,这些数据都是一种结果,就是金融机构购买这个数据的结果,包括逾期、保险理赔、车险理赔,但我们要研究的是,这个果是由什么因导致的,我们现在说大数据更强调的是一种相关性分析,而不是一种因果分析。

  保监会发布了车险费率改革,费率要做调整,以前跟费率相关的只有三个因子,一是你的车的价格;二是你车的使用年限;三就是你的历史出现情况。这个非常像我们的央行征信机构用历史说明未来。我们现在做的是研究一个人的行为习惯于他车险出险之间的关系,这是纯粹的相关性,这是纯粹的大数据研讨。假如我们是A,因为A所以有了B,因为A所以有了C,那B和C之间是什么关系?他们之间可能会有相关性,我们可能解释不了B和C之间的因果关系,但能从数据上说明B和C是有相关性的。A是人的长期行为习惯、做事方式,性格是急躁还是稳重,慢性子还是急性子,导致B是什么?他开车是不是急躁,是不是经常急刹车,是不是导致经常出险。C是什么,性子急的人?是不是喜欢看一些什么网站、消费一些什么东西,是不是喜欢看新闻、喜欢看军事。我们研究表明,看新闻和军事的人信用比较好也不容易出险。这就是因和果的关系。

  央行的信贷数据外部是很难获取的,所以金融机构应该从外部想一些外部数据的办法。我讲一讲具体技术层面的事,怎么利用线上、线下的大数据做金融建模。

  传统的风险建模思路就是用历史说明未来,现在央行这类数据只有2.75亿,实际上还有十几亿的客群等着我们开发,真正要做到国务院提出的普惠金融,要把这十亿人群服务好,传统的方式有缺陷,我们要研究突破。传统的是用了一个10个到20个强变量,建立这样一个运算关系,就是建立他之间的相关性。这10个20个强变量是有明确因果性的,你是什么样的人以后也是什么样的人,用这个理论大概只占了25%,我们还有75%的空间,但这75%怎么做呢?确实用传统方法没法解决这个事情,所以我们要结合线上、线下融合大数据的思路来解决。

  我们正在尝试使用金融数据进行建模,能够采用建模的数据量大概在50万左右,为什么会有这么多?实际上我们底层的原数据大概在2-3千,建模的时候用了非常多的衍生变量,有一级衍生、二级衍生、三级衍生,不停的验证效果,最后衍生出来有50万个变量左右,我们就在这50万个变量定模型,用很多方法:回归方法、决策树方法,各种各样的建模方法。我们的变量是X1—XN,主要是消费行为、阅读行为、社交行为、旅游行为,这里面除了线上的数据还有非常多的线下数据,以及大量跟政府合作的包括公安数据、教育数据、交管局等这样的数据。国外做大数据分析相对是有成熟经验的,变量也非常多,大概引用70万个变量。

  我们的一些股份制银行合作伙伴,通过我们的建模,能够帮他们的不良率降低一倍左右,我们主要的风控核心思路是:第一,欺诈风险的防范;第二,信用风险的防范。欺诈防范,主要是核实真实身份;信用风险防范,主要以行为数据作为核心。

  我们积累了非常多的线上数据,实名客户已经达到6.1亿,匿名客户(不能到身份证的、手机号的,只能到设备号的)大概10亿左右,所以我们集成了很大的数据集,使得做风控也好、营销也好,变成了一种现实。

  作为一个大数据公司,要立足我们自身的数据资本,就是必须把数据安全做的很好。

  圆桌讨论环节

  主持人陈旸:大数据结合P2P理财,能帮助我们来甄别这些非法的渠道吗?

  周勇:数据是能够让我们辨别平台本身是不是靠谱的非常重要的渠道,比如一个P2P网站,公司信息只显示副董事长和行政总监。这种,就不用投了。因为如果作为一个金融机构,做技术、风控的人是非常重要的。如果没有这些人员,这个平台的安全性是存忧的。

  主持人陈旸:是否发生过金融欺诈的问题?通过大数据怎么辨别这些问题?

  张毅:百融有一个反欺诈联盟。我们会发现几个行为。第一,中介养卡。中介先帮忙给金融机构提交虚假材料做申请。第二,材料过审以后再做两笔小额借贷业务,这样在央行里数据库就有了借贷信息,生成信用报告。第三,借一笔大的借款,然后跑掉。金融机构很难能防范到这样的问题。

  实际上我们的理论是,在用一个不是在金融领域里面的这种强变量或者强行为去做金融的反欺诈。在用户进行消费或者交易的其他行为时,利用这种大数据分析,可以更好的能解决一些欺诈行为。

  主持人陈旸:大数据征信和传统征信到底有什么不同?我们大数据的优势体现在哪里?大数据的应用又给征信行业带来哪些新的商业模式?

  周勇:大数据对于征信带来的变化非常大。第一,数据多维度化。很多在央行系统里没有征信报告的人可以通过更多的数据对其信用做一个非常好的评估。第二,数据海量化。现在国外有的互联网金融信用公司,数据变量7万个,以前仅仅几十个,面对这么大数据量,只要逻辑是对的,生产出来的结果就会更加精准。

  张毅:“大数据时代一切皆可收集、一切皆可计算、一切皆为信用”。现在做大数据征信的机构,对于央行的征信体系是一个有力的补充。

  吕佳琦:大数据征信有两方面优势。第一,维度广。过去的征信只看借贷记录,现在会考虑入网购、交款记录等社会行为。第二,时效性强。传统征信的数据很多是几年前的记录,现在是分析过去一个小时内的记录。

  主持人陈旸:如何来利用大数据甄别客户,判断能否进行借贷,借多少额度?

  周勇:看各种数据。比如房租记录、团购、旅游等信息,是否有抵押物,给用户做一个画像。根据画像判断放贷额度。

  张毅:放贷额大小是衡量用户信用价值多少的参照。通过判断欺诈风险安全后,了解用户的借款用途、还款来源做一个考量。

  主持人陈旸:大数据领域中国在实操中有没有规定一些信息是不可以采集的,如基因、疾病等信息?包括实际操作层面是怎样的?

  董峥:征信管理条例里面提到比如民族等几个维度是不许采用的。曾经美国也对西班牙裔、墨西哥裔的客户产生排斥。

  周勇:有几个我认为算是违规的情况,第一,未经授权就采集信息;第二,只授权一次,但一直采集用户信息;第三,约定采集信息的用途和最终用途不一致。只要未经客户授权,而且违背当时的授权信息也不应该采集。

  吕佳琦:政府职能部门,比如说法院的审批文件,涉及到个人隐私和商业机密都是禁区。

  主持人陈旸:央行批准了8家机构可以做征信,包括像芝麻信用、腾讯征信这样的互联网企业,第一次进入征信机构的名单。阿里、腾讯在做征信业务时和其他的竞争对手站在同一起跑线上,有没有优势呢?

  吕佳琦:阿里或者腾讯,他们有自己的平台,如淘宝、天猫、支付宝等,可以去征信个人的社会行为,这个是他们的优势。

  张毅:对于BAT企业,他们有自己的用户数据,比如像阿里的电商、腾讯的社交、百度的搜索数据,但征信是需要广维度的、强调数据质量的。他们更需要外部数据源作为有效的补充。

  董峥:我认为他们就是一个闭环系统,从数据采集上说,他们做的只是在平台的购买行为数据分析。其实,征信和买多少东西不是一个必然联系。

  主持人陈旸:央行征信中心获取征信是免费的,民营机构做征信会不会收费?

  张毅:短时间不会,收费是针对技术处理数据的硬成本。什么样的费用是合理的?大家有征信的氛围,市场的一种机制以后才能慢慢的把价值体现出来。

  董峥:像这种费用,更多是要授信方去承担。对于用户来说是没有意义的,成本不要强加给用户。

  周勇:长期来看这收费不是问题。未来一定是放开的过程,通过企业竞争会让定价合理。

  主持人陈旸:这些证信的民营机构,未来的盈利模式主要是哪块?对他们的盈利前景看好吗?

  周勇:征信公司也在做更多的业务创新,开始出现细分市场,有的公司专门做地级市、县级市法院的判决征信,有数据就好似有了石油,你想你有石油了还怕什么。

  张毅:做大数据这个事情非常苦,市场前景份额也不像说现在大家说的这么大。

  董峥:征信我们现在做的太少了,也没有规范。当个人信用成为个人名片的时候,这个金矿就随便挖吧。

  主持人陈旸:未来5—10年征信市场相对成熟以后会出现一个怎样的格局?

  周勇:现在还是一个加速发展的过程,日后有可能通过牌照管理、市场竞争留下大概10家以内征信公司。现在的互联网金融发展,对大数据征信的需求越来越大,对于市场来讲,容量是足够的,就看各家谁跑的快。

  董峥:一方面是快速发展,另外一方面,加快法律体制建设。

  吕佳琦:可能将来会衍生一些其他的征信服务,如征信咨询之类的,整个征信行业的发展一定是有利于个人的,不管是说借贷方还是放贷方。

  互动提问环节

  听众:国内很多电商平台给用户购物提供一定的额度,但在填写一些个人信息之后,就会莫名其妙的接到一些广告电话,不知道咱们在产业内对于接下来的像这种类似的情况会不会有一些防范性的做法?

  周勇:目前防范可能几个方面。第一,企业内部合规的管理,如何确保用户信息的安全。第二,加强技术上防范,防止用户隐私泄露。第三,行政、法律跟上。

  有一家第三方支付机构,泄漏了几千家银行卡信息,导致有人做了伪卡消费,造成近4千万的损失。但是后续相应的处罚结果怎么样没有公示,这方面需要行政、法律规范。

  听众:中国的银行是比较强势的,如果出现我个人的信用卡或者什么卡被盗刷了的话,一般如果我个人没有充分的举证,是必须要把这个卡还上的,面对这样的情况,对于我们个人来说有什么建议吗,如何防范这个事?

  董峥:关于盗刷,需要尽快建立银行卡风险承担机制。机构需要有快速处理的能力。关于如何防范,第一,把磁条卡换成芯片卡。第二,不要让任何外人获取卡片任何一个信息,包括号码、有效期、后三位。第三,给信用卡设置密码。

相关阅读

永不行贿不只是马云的理想

“永远不行贿”需要商人修身自律、敬畏法律、坚守底线,同时也离不开与之相适应的社会环境。过去为什么很多企业一到年底就要跑机关,给各个部门的办事人员送钱送卡?还不是一些官员平日里吃拿卡要,暗中搞灰色利益链条?

抢银行为他开启16年美好人生

为什么,一个肮脏的起点,开启了16年的美好人生?为什么,一次高风险的抢劫,成就了16年的创富佳话?除了“精明能干”之外,恐怕还因为他选对了方向,以房地产为支柱产业,在某段时间,就是国家的方向。石二群在冥冥之中,践行了那句励志的话:国家的方向,就是你的方向……

用苹果手机女士为何有优越感

真正的高贵,一不在于高,二不在于贵。如果言行粗俗,即便有了“土豪金”,也难掩“土鳖相”;哪怕获得VIP待遇,也同样是“威啊屁”。所谓“贱人就是矫情”,就是因为贱人没有其它可以炫耀的情调。

官员巨额房产真经得起审视吗

《党政领导干部任职回避暂行规定》明确要求,“领导干部的配偶、子女及其配偶……经营企业,该领导干部不得在上述企业的行业监管或者业务主管部门担任领导成员”,但规定只涉及到配偶和子女及其配偶,官员父母经商情况并不在任职回避的范围之内。

  • 马未都:“三少年杀老师”太可怕
  • 罚迟到学生抄千遍biang字该不该
  • 美国内战女间谍伊丽莎白的神奇一生
  • 张惠雯:习惯一切冷遇只为忠于自己
  • 专访王千源:《解救吾先生》背后
  • 婚姻:夫妻要做哪几件事幸福才长久
  • 吐槽:摩纳哥不一样的玩法
  • 0