-
首页
-
学院概况展开 / 收起
-
学院概况
sidenav header background【20周年庆论坛】大数据:一场新的技术革命
发布日期:2014-05-06 11:13 来源:北京大学国家发展研究院
题记:当你在网络上搜寻“大数据”这个关键词,在谷歌里面有4.8亿条结果,在百度里面有1亿条结果。如果你搜寻“互联网金融”,谷歌有9.9亿条,在百度有接近1亿条。由此可见这两个词语在当下的火热程度。但是你真的了解这两个词语背后的含义么?大数据与互联网金融论坛对此进行深度解读。
4月19日下午,北京大学国家发展研究院二十周年院庆“企业高峰论坛”分论坛“大数据与互联网金融”举行。本次分论坛分成题为“大数据”和“互联网金融”的上下两个半场。论坛上半场发表致辞和演讲的嘉宾有:北大国家发展研究院副院长、BiMBA院长张黎、阿里巴巴集团副总裁、数据委员会会长车品觉、微软亚洲研究院主管研究员郑宇。
张黎:细分客户需求 大数据追踪消费者行为我们经常能看见社会上对于“大数据”的各种赞美,但是大数据究竟为我们的生活带来了什么?张黎认为“大数据是一种新的技术革命的发生”。营销最重要的是对客户的需求进行细分,然而想准确做到这一点并不容易。传统的方法是对总体进行抽样,根据调查对象的选择来了解他们的行为,把不同的行为选择变成相应的变量,然后基于变量刻画不同的群组特征。这种方法确实能够说明一些不同群组所具有的需求特征,但是却有一个巨大的问题:你的被访者说的很有可能和做的并不一样。为了改进这种缺点,我们又开始模仿一些真实的购物环境,让受访者去选择。通过建立联合实验法去了解不同群组的消费者行为特点。但是这种方法的准确度依然值得商榷。
张黎院长认为我们要感谢大数据——“大数据让我们知道一个人的行为,大数据使得一切变成了现实”。人们在网页的浏览、通过网络购买的东西、交通的路线,银行卡记录甚至在网络上的发言,都会被大数据记录下来。“这些参数成为了人们在雪地里走的每一个脚印,通过这些脚印我会清楚地知道你是谁”。这正是大数据给我们这个社会带来的巨大的改变。但是张黎随后提出了一个问题:大数据到底是什么?在商业和城市规划、医疗保险里有什么样的应用?这成为了整个上半场演讲和讨论的焦点。车品觉:数据的解释和应用更为重要
在中国只要提到大数据的例子,就必然会提及淘宝“双十一”活动。而对于阿里巴巴集团副总裁、数据委员会会长车品觉而言,知道“双十一”促销中前5分钟进来的人到底是谁,他们是怎样的情况,却是一个更加重要的问题。因为这5分钟可以解释的东西要远远大于整个活动的其他时间。
作为数据专家,他认为大数据一定要有四个特点,即4个V:Volume(体积), Velocity(速率),Variety(种类), Veracity(准确性)。这4个V要求的就是数据的可解释性。“我们不再只需要一个数据模型,我们更加需要的是数据可以解释给我们的东西。同时我们还要知道数据是从哪里来的,只有这样我们才能够知道数据是否有用”,车品觉说到。大数据在这一点起着至关重要的作用,它使得对数据的解释变得更加容易。
但是大数据不是万能的,大数据也有自身的困境。“今天早上我看见一件衣服,我在电脑里搜索,而我搜索衣服时候看见了一个手表,但这个时候我被老板找去开会。开会的时候我用手机买下了那块手表,这是整个的购买过程。但在数据库里面,我们只关注这个人买了一块手表,不会关注他之前早上的时候看见的那个衣服,也没有人知道其实这个人之所以没有点搜索的结果,是因为他要开会,更没有人知道这个拿着手机淘宝的人,和用电脑上网的人是同一个人。当然你也不能识别在PC里面的人是老公还是老婆,有时候他们是用同一个ID的。”
同时即便在大数据中我们有时也要放弃一些数据。以前当我们提到大数据的时候,引以为傲的就是数据规模极大,我们保留有所有的数据。但是现实中有些数据是有可能过时的。“比如淘宝两年前的用户数据,我们现在就必须放弃”车品觉介绍说,“因为网站已经变了,数据的场景也变了,所以数据的生命周期也变了”。
所以并不是大数据就一定是好的,企业更加需要的是实效数据。你要理解业务的场景,你要有应用数据的能力,你要回答有没有解决这个问题,以及下次怎么改进。现在企业最大的问题是用的人不知道有什么数据可用,但同时做数据的人也不知道别人怎么用他的数据。当使用数据的人更改了数据的一个基本维度,那么对于做数据和整个公司而言都可能是一场灾难。因此企业最困难的是数据文化和数据管理。存什么数据、开放什么数据是数据管理层必须要考虑的问题,“这也是我最近一直思考的问题”。
郑宇:城市计算——大数据中的大城市的“大挑战”
现在的城市越来越大,问题也越来越多。如何能够有效的处理是城市管理的核心内容。但是这些问题非常复杂,城市相互关联的方面太多,这就使得“牵一发而动全身”,我们并不知道为了解决这个问题会带来什么其他后果。然而大数据的出现为我们提供了一种解决城市问题的途径,那就是基于大数据的城市计算。在美国,这种方法已经开始使用。而在我国,郑宇博士正是研究这一领域的佼佼者。
城市计算是一个十分复杂的事情,它包括四个环节:城市感知,城市管理,城市数据的分析和挖掘、服务提供。它是一种多数据的方法,包含的数据种类非常多,可以是城市的路网图、城市的兴趣点数据、空气质量指数数据、气象数据、社交位置的服务数据,甚至还有出租车的轨迹数据。当多种数据相互融合对比之后,它就可以解决很多问题。比如可以改进城市规划,缓解交通拥堵,了解城市商业模式的变化,也可以解决打车难,实时监控城市油耗。
同时,城市计算还能解决另一个非常重要的问题:空气污染。在现实中,我们不可能在所有的地方都建立空气检测点。原因是站点非常贵,不仅要花巨资买设备,还要占地。但是由于空气质量的影响因素非常复杂,一个城市里面空气质量是不均匀的。以北京为例,同一时刻北京的22个检测站点对空气质量的检测数据会差得非常多。因此空气质量并不能用一个平均读数,也不能通过简单的差值计算来代表其他地方。这造成的一个结果是在没有检测站点的地方,我们根本就不知道它的空气质量是多少。而如果我们无法获知这个关键数据,我们就无法对我们的健康状况提供可能的必要保护。
为了解决这个问题,郑宇团队利用了两方面的大数据,来做实时的细密度的空气质量更新。第一是基于历史和时时的空气质量数据来进行。另外一个是其他数据,包括气象数据、交通流量数据、兴趣点数据,和道路结构数据。在计算这些数据后他们可以测算出城市里每个角落的空气质量。而政府可以利用这些数据去寻找降低空气污染的最主要的措施。而更重要的是,通过这种大数据的对照方法,他们的准确率比传统的动力空气学模型计算提高了20%,达到了80%的高准确度。
城市计算另一个功能可以用来校验城市规划。城市一直处于变化当中,之前我们的规划可能因为多种因素变得不再那么合理。所以我们的城市规划也应该是一个动态的变化过程。但是城市的居民需要什么?规划应该如何变化?传统上政府很难了解这些问题,而城市计算通过对比城市的兴趣点和人口流动图,则能给出一个准确的答案。
如果你很讨厌去加油站加油的时候要排队,也可以找“城市计算”帮忙。它能告诉我们什么时间去加油站加油排队时间最少。郑宇博士通过计算得知,在早上8点钟早高峰的时候,平均等候是12分钟,而到晚上8点钟,平均时间是6分钟左右。“所以我都不在早上的时候给车加油”,郑宇博士说。然而在这种加油的排队时间背后却反映了加油站的人员设施是否优化,布局是否合理。排队人多的区域说明加油站不够,要考虑建新的加油站。而有的区域加油站过度建设,就没人去加油,结果造成大量的浪费。而这里所需要的仅仅是所有出租车司机在不同加油站加油的时间对比图,“大数据正是通过这种小的弱相关的区域里面解决城市规划和能耗问题”,对于城市管理,郑宇博士认为只有做好大城市大挑战中的大数据,做好数据管理、数据挖掘和数据分析,我们才能做到居民、城市和环境的三赢。而他将这一程式称为“3BMW”。
论坛下半场“互联网金融”发表致辞和演讲的嘉宾有:北大国家发展研究院副教授徐建国、宏源证券研究所副所长、互联网金融千人会秘书长易欢欢、宜信公司创始人、CEO唐宁。以下为下半场嘉宾发言的精彩摘要,以飨读者。
下半场一开始,主持人北大国家发展研究院的徐建国副教授就提出了三个问题:互联网金融这个东西到底怎么理解,为什么他对中国的影响比美国要大?互联网金融它和我们传统的金融行业到底是什么关系,传统金融业为什么不做互联网金融?互联网金融怎么样来替代传统金融行业,里面可能的风险是什么?徐建国教授以这三个问题,引出了下半场的讲座。
易欢欢:监管不能简单“一枪打死”
在听到这三个问题之后,宏源证券研究所副所长易欢欢抛弃了准备好的内容和PPT,围绕这三个问题展开了他的演讲。
易欢欢认为,当技术把我们每个人都变成一个在线的信息时,我们的信息和数据就能在互联网上自由的流转。这时候叠加的金融、教育、医疗等更多的服务就会自然而然地以互联网的方式出现。在这个过程整个互联网的生态也发生了改变。百度还是搜索引擎公司吗?阿里还是电子商务公司吗?腾讯还是社交网络公司吗?它们后面有非常多的企业,非常多的应用,负责非常多的服务。所有的传统互联网公司都变成了生态系统概念,而美国和中国公司巨大的差异导致了两国对互联网金融的态度不同。富国银行10%的利润来自于存贷差,绝大多数的证券公司靠交易佣金和通道业务盈利。但中国银联的99.9%的盈利是手续费,其中其他的相关服务占了重要部分。因此互联网金融公司进来时,他会在选择一项或者两项标准化业务上免费,以此获得用户和数据,再通过其他的非标准化的应用,进行增值收费。易欢欢认为这其中涉及了到底是看中用户还是看中资产,看中客户体验还是看中变现的问题。正是在在这种巨大的冲击和对撞中,互联网金融在中国产生了一个巨大的影响。易欢欢认为,一方面是中国的虚拟化程度更高,所以在PC互联网转向移动互联网的过程中,中国更容易寻找新的变现方式;而另一方面还因为中国金融体系的不完善所带来的变化的过程,要应对这种变化,就要采集更多的数据。
对于很多人认为互联网金融只是做银行简单的存贷汇业务的看法,他以Google为例,认为一个行业整体的布局和卡位非常关键。当我们找到竞争对手未来的突破点,提前进入禁区对其拦截的时候,每个用户的信息和数据会变成你的资产,而这就是新的创新点。
最后易欢欢结合他在美国的经历谈论了对互联网金融监管的看法。在美国超速20%以内是不会有人抓你的,只有你超速过多的话才会有人找你。有一次一个特斯拉用很快的速度超过了他,但随后一个警车用更快的速度追上特斯拉并将其抓获。他认为这才是监管。新的监管要运用新的技术手段来打击出现的违规方式,而不是“骑着自行车发现特斯拉速度快然后一枪把对方打死”。新的监管应该使用新的信息手段。“我们能不能通过谷歌的方式,在线上去全面进入到有可能出现的所有盲点,这样在出现一些风险的时候,我们的监管机构能不能通过大数据的方式去提前预知,提前预感?”易欢欢在演讲的最后留下了这样的疑问。
唐宁:拥抱彼此的互联网与金融
宜信公司作为世界上最大的B2B模式的企业,其最开始的来源是给贫困学生找贷款。
唐宁早期从事教育培训工作。当时有一些贫困学生找到唐宁,希望机构能够让他们延缓付款,或者边上课边付钱。唐宁为了帮助这些贫困学子,希望能够找到一些人或机构给贫困学生的职业培训进行贷款。然而唐宁跑遍了教育培训界和金融界,没有人愿意做这个事情,于是唐宁自己做了起来。对于贷款而言,信用教育、信用评估、信用审核是非常重要的环节。然而当时什么数据都没有,他只能考察这些借款的同学里面,是否有学生干部、党员,是否有过爱心献血的经历。最后唐宁把这些简单的数据变成借款同学的信用数据。
所以唐宁对今天的大数据感受很深。一方面有海量的信息,但是另一方面,相对基础性的信用评估、风险控制工作,其实真正管用的数据却非常之少。
而正是当时这样一个实验,在成为了市场模式之后,就变成了后来的B2B。
所以技术也在不断的发展,高科技也推动着互联网金融行业的发展。唐宁他们考察了Lending Club,对于他们通过互联网做事情的方式非常羡慕。“那么在中国现实不现实呢?”
带着这样一个问题唐宁开始了他的思考。他发现仅仅依靠互联网,仅仅依靠互联网的数据,虽然有很多交易数据、社交网络的数据,但是进行信用评估和风险控制,在中国现阶段还是非常不够的。“由于我们无法直接从银行取得联系,所以反欺诈是一件非常重要的事情”。因此唐宁在去年成立了大数据团队,将所有的欺诈信息入库,然后用大数据的方式来找到其中的共性。同时我们大数据团队还对如何能够找到违约者起到了非常重要的作用。同时大数据专家还要到互联网上寻找消失的借款人的蛛丝马迹,追回债务。然而大数据虽然有帮助,却更多属于增信的范畴,并不是信用判断。因此线上线下相结合的方式才是最好的方式。
唐宁最后表示互联网金融其实是互联网高科技给金融插上了翅膀,能够让金融覆盖更多的客户。要重视互联网,但是互联网也不是万能的。虽然未来所有的都会是互联网的,然而这并不意味着过往的事情都要被新经济所取代,它们最终拥抱了彼此。因此互联网金融创新,对于传统金融机构是非常好的补充,技术和金融将会越来越好地融合。
京盛世景投资管理有限公司董事长、北京大学国家发展研究院BiMBA2006级EMBA校友吴敏文、厚泽投资董事长、管理合伙人、北京大学国家发展研究院2001级博士校友方健亦在此论坛上进行了深入研讨。