周涛27岁就被聘为教授,是电子科技大学互联网科学中心主任,他用时4个月时间翻译了《大数据时代》。作为一名实践者,周涛还是百分点科技有限公司首席科学家。
在中关村的微软大厦里,周涛对大数据娓娓道来。在北京,大数据产业链正在形成,而远在千里之外的杭州,马云和阿里巴巴已经将无声的数据变成诱人的财富。
就像石油、矿山对于工业革命一样,大数据散发出令人难以抗拒的财富气息。无论是互联网巨鳄如谷歌、亚马逊,还是租用中关村一间办公室的“80后”青年,都试图从微博的每一条点评、淘宝上每一单交易的零碎数据里,挖掘到商业机会。
在社会舆论火热的背后,是一股什么样的浪潮冲击着人们的思维?
一场颠覆性的革命
我们先从大家都习以为常的一个网页点击说起。
如果你在亚马逊购买过东西,下次登录时,首页上推荐的商品一定是与你上次购买商品相近或者配套的。比如你曾买过《基业长青》,再次登录时,推荐的商品将是其他管理类书籍,如《蓝海战略》、《长尾理论》,因为你已被亚马逊定义为管理学书籍爱好者。很多消费者在购买的时候,都会选择这种“打包”服务。这样越积越多,让亚马逊赚得盆满钵满。
在亚马逊页面背后,是看不见的数据分析能力。这种建立在大数据分析基础上的商品推送模式,跟亚马逊CEO贝索斯的理念相关。贝索斯认为,建立在大数据基础上的推荐算法,能够给用户提供他们真正需要的产品,而传统的商业促销缺少充足依据,很多时候推荐给用户的并不是他们真正需要的。所以,你极少能见到亚马逊有促销活动。从本质上说,这是对传统商业模式的一次颠覆,用亚马逊公司首席科学家的话来说,“数据就是新的石油”。
2012年初,在瑞士达沃斯论坛上,一份《大数据、大影响》的报告宣称,数据已经成为一种新的经济资产类别,就像货币和黄金一样。“未来除了土地、资源、人才等经济资产外,数据将会成为最重要的资产之一。”周涛告诉《决策》:“大数据将逐渐成为现代社会基础设施中的一部分,和公路、铁路、港口、水电、通讯网络一样不可或缺。”这实际上是对传统思维的一种颠覆。
从发展态势来看,大数据标志着“信息社会”真正名副其实。“政府也开始关注大数据,考虑如何改变决策支持系统,提高行政效率,从而增强政府竞争力。”国家信息中心网络政府研究中心副主任于施洋告诉《决策》。
美国政府先行一步。奥巴马认为,数据在未来将是陆权、海权、空权之外的另一种国家核心资产。美国白宫科技政策办公室在2012年3月发布《大数据研究和发展计划》,同时组建“大数据高级指导小组”,以协调政府在大数据领域的2亿多美元投资,这标志着美国把大数据提高到国家战略层面,形成全体动员的格局。在英国,卡梅伦首相提出一个全新的“数据权”概念,再次冲击着人们的思维习惯。
更具有革命性的是,数据信息不像煤矿、铁矿是越挖越少,信息是可以循环使用、不断复制的,能够为创新提供取之不尽的燃料。这种全新的“信息生产力”将从根本上颠覆长期以来固有的经济资源观。
大数据的“炼金术”
大数据的魔力在哪里?我们还是从每天都会发生的一次点击说起。
如果你是一位微博用户,你的每一次点击和评论,都是在为大数据海洋“注水”。现在,每天的推特能产生80亿单词量,Facebook上每天分享的内容条数多达25亿。这些海量的、非结构化的、部分开放的数据,已经催生出一系列围绕数据而生的创业公司。
比如在北京中关村,当你看到微软大厦里走出一个带着耳机、背着挎包的小伙子时,他可能正在思考大数据分析及其应用,或许3-5年后他就是新兴产业的弄潮儿。
另据全球最具权威的IT研究与咨询公司Gartner统计,大数据带动了2012年全球280亿美元的IT支出,2013年带动的规模有望增至340亿美元,到2016年全球在大数据上的总花费将达到2320亿美元。作为数据开发和运营商,中国移动安徽有限公司董事长、总经理郑杰分析说:“一旦思维转变过来,数据就能被巧妙地用来激发新产品和新型服务。以大数据为基础的解决方案,是产业升级、生产率提高的重要手段。能从数据中发现价值,产生财富,才是大数据最吸引人的地方。”
而且,大数据的渗透力极强,本质上各行各业都已经数据化,电信业变成电信数据业,金融业变成金融数据业,医疗服务也变成医疗数据业,这也许正是大数据的魔力所在。“从经济统计来看,大数据在2011年帮助美国零售业净利润增长60%,帮助制造业在产品开发、组装环节节省50%的成本,为全球的个人位置服务提供商贡献了1000亿美元。大数据为美国医疗服务业每年带来3000亿美元的价值,为欧洲的公共部门管理节省2500亿欧元。”国家信息中心专家委员会主任宁家骏告诉《决策》。
2011年5月,麦肯锡发表《大数据:下一个创新、竞争和生产率的前沿》认为,“我们正处在一个巨大浪潮的尖峰。这个浪潮,就是大数据驱动的创新、生产率提高、经济增长以及新的竞争形态和新的价值的产业。”
实际上,从麦肯锡发表报告的两年来,都还只是开始。据国外咨询机构预测,大数据将创造数以万亿美元计的年产值。携程旅行网总裁范敏说:“五年之前说大数据挖掘,基本不太靠谱,因为基础存量不够。而今天,谁忽视了大数据挖掘,我相信就没有明天了。”
让数据“开口说话”
2013年3月全国“两会”上,作为全国人大代表的郑杰,提交了一份“大数据发展上升为国家战略”的建议。“从国内外经验看,通过用数据来决策、用数据来管理、用数据来创新,已成为提升国家竞争力的一部分,中国必须重视大数据的价值和作用。”郑杰告诉《决策》。
美国管理学家爱德华·戴明有一句名言:“除了上帝,任何人都必须用数据来说话”,在最近两年里流行一时。但真正做实大数据,应用到企业竞争和政府公共管理中,也是最近两年的事。
采访中,于施洋告诉《决策》一个医保费用管理的案例。
一个地级市有多家医院,每天都会产生医保单子,一年下来会积累数量庞大的医保单,但这其中必然存在许多不规范甚至是故意骗取医保的违规行为,如何来解决?如果是一个一个来复查是不可能的。通过运用大数据交叉比对,现在一个月卡住的不应有支付是3000万元,一年就是3.6亿元。如果扩展到全国600多个城市,一年下来将是1000-2000亿元。
这就是一个让数据说话的典型案例。作为最早认识到大数据价值的人之一,马云希望阿里的数据为国家经济扮演一个“气象预报台”的功能,“为每个小企业装上GPS,为每艘船装上雷达。”
但是,如何让数据有智慧地说话,中国企业做得并不乐观,很多公司还远没有真正意识到大数据的价值,也不知道如何利用,仍然是“坐在金山上啃馒头”。2012年,有很多大公司的副总裁或数据部门负责人跑到杭州向阿里集团数据委员会会长车品觉请教,他们问的最多的问题是,大数据部门该放在运营团队还是技术团队?“一听这个问题,我就知道他们走错路了,怎么做都没戏。”车品觉告诉《决策》:“大数据应该是CEO直接领导的战略级部门。”
放到宏观层面上来看,“中国发展大数据的政府基础、社会基础、产业基础都已经具备,却面临许多短板。”于施洋告诉《决策》,“政府在信息运用上,仍然处在第一阶段,即单纯的信息发布,还没有真正迈入大数据支撑决策的阶段。即便是在第一阶段,政府做得也还不够好。”
中国互联网信息中心发布的报告显示,各级政府门户网站提供的信息类别趋同,80%以上提供的是部门介绍、政策文件、法律法规、政府职能、业务介绍5类信息。新闻消息类信息的每日更新率是36%,其他信息的每日更新率不足30%,有超过40%的政府网站每半年才更新一次。“真正有价值的企业运行、税收、财政收支、海关报关等数据,都是长时间不更新,恰恰是这些数据才能发掘出价值,进行经济运行分析。”国务院发展研究中心技术经济部研究员李广乾告诉《决策》。
大数据时代,谁主沉浮?周涛认为,中国在大数据方面与英美等国的差距不大,中国惟有踩在新浪潮的尖峰上,才能避免重蹈计算机时代、互联网时代“追赶者”的被动局面。“在以物联网、云计算、大数据、3D智造技术等新兴产业为核心的第三次产业革命中,中国有希望弯道超车。”郑杰分析说。
链接:何为大数据
何为大数据?两年来,还没有一个得到公认的固定说法。业界普遍认为,真正的大数据时代是从2012年开始的,最显见的标志是数据量之“大”,推特每一天都产生80亿单词;互联网一天中产生的全部内容可以刻满1.68亿张DVD;从出现文字记录到2003年,人类总共创造出5EB(百亿亿字节)的数据,现在仅两天就能造出相同数据量。其次是价值“大”,如果对海量数据进行“二次开发”,就会发现蕴藏其中的财富,获得商业利益,还可支撑政府决策,服务公共管理。
最早洞见大数据时代发展趋势的数据科学家维克托·迈尔-舍恩伯格有一个形象的比喻,“就像印象派的画风一样,近看画中的每一笔都感觉是混乱的,但是退后一步你就会发现这是一幅伟大的作品,因为这时你能看出画作的整体思路了。”谁能率先从大数据分析中发掘价值,谁就能握住那支画笔。
涂子沛:为大数据代言
他的这些计划有一个共同的主题,就是关于大数据的演讲。自从2012年7月,他的《大数据》一书出版畅销后,国内的邀约纷至杳来,让这位美籍华人经常在太平洋上空飞来飞去。
“理工男”的人文情怀
涂子沛在新浪博客上的自我介绍是:信息技术经理人,多家媒体专栏作家;毕业于华中科技大学,曾在武警部队和政府部门工作十年;后辞去公职赴美读书,获卡内基梅隆大学公共管理硕士、信息科学硕士学位。
从华中科技大学再到留学美国,作为计算机专业的毕业生,涂子沛是一个名副其实的“理工男”。他微博上的一句耐人寻味的签名,也略能体现理工男孩的特质:思想可复杂,生活要简单。
2008年,涂子沛从卡内基梅隆大学毕业时,正碰上严重的国际金融危机,被卷进失业大军。紧张而又辛苦的留学生活过后却没工作,“不免郁闷”。塞翁失马焉知非福,“宅”在家里的涂子沛有了更多的时间写博客,记录自己在异国他乡的生活和感受。偶然中,一篇文章被中山大学郭巍青教授读到,经他推荐后发表在2009年9月的《时代周报》上。
没想到的是,这篇文章的反响出乎意料,涂子沛陆续接到《新快报》、《南方都市报》、艾瑞网等报纸网站的邀约,写起了专栏。于是,一个崭新的写作空间豁然打开,虽是“理工男”,却有着令读者赞赏的文笔和视角。
边工作边写作,涂子沛在文理之间自由穿梭。
涂子沛就职的美国公司,是一家政府合同商,致力于为各级政府部门提供数据解决方案,每天面对的东西都是数据、代码或大大小小的表格。现在他是这家公司技术部门的主管。“通过一个又一个项目的‘亲密接触’,我真真切切地透视到数据在美国政府和企业当中的重要作用。在深入了解其成因、背景和趋势的过程中,我常常被数据的力量和美感所震撼。”涂子沛说。
“力量”和“美感”是涂子沛用来形容数据工作的切身感受,而曾经在中国政府机关工作过10年的他知道——“数据治理”的管理方法和竞争态势,至今还不为国内的政府、企业和大众所熟悉。“这触发我产生了一个系统的中文写作计划。”涂子沛想将这种“力量”和“美感”传回国内。
从2011年6月起,全书21万字,历经8个月后最终完稿。
2011年底,涂子沛将书稿寄给国内几家出版社,一家出版社的编辑对他说:“不管别人开出什么样的条件,我们都要。”而另一家出版社的编辑则给涂子沛回了一封邮件:“这是一本中国社会需要的书。”
2012年7月,《大数据》由广西师范大学出版社出版面市。翻开这本以0和1的二进制代码图案为封面的新书,扉页上的题记别具一格:“一个真正的信息社会,首先是一个公民社会。”
“我一直相信科技可以让生活变得更加美好,但前提是我们要有一个积极的人文精神和人文关怀。从人文角度来看,收集数据是一种意识,使用数据是一种习惯,开放数据则是一种态度。我是理工男出身,若没有当年大学听人文讲座的经历,也可能就没有今天的《大数据》。”涂子沛说。
汪洋荐书
《大数据》一书出版3个多月后的2012年10月8日,时任广东省委书记汪洋视察广东省财政厅,与以往不同的是,这天汪洋的讲话是“以《大数据》内容为纲发表重要讲话。”汪洋说:“休息这几天,我看了两本书,其中有一本是一个美籍华人涂子沛写的《大数据》,看了以后非常有启发。我推荐你们全厅干部都看一下这本书,研究一下大数据时代。”
结合涂子沛的《大数据》内容,汪洋谈到大数据对政府部门的重要意义:现在大数据战略被认为是世界下一个创新、竞争和生产力提高的前沿,是争夺全世界的下一个前沿。将来引导我们政府前进的是基于实证的事实,而不是利益集团在政府决策过程中施加的影响。我们基于这些数据说话,将使政府更有效率、更加开放、更加透明。
依据发达国家经验,财政数据是最适合开放的政府数据之一,汪洋也首先选择了在广东省财政厅推荐这本书,并希望能用大数据的理念来改善目前的财政工作。
汪洋还特别强调说:“我希望大家能认真读一读这本书,带着问题读、带着想法读,怎么样促进财政数据的收集,怎么样加强财政数据的分析,怎么样挖掘数据背后有利于我们增加收入、改进支出的有用因素。然后逐步推进财政数据的公布,调动全社会监督的力量,使我们的工作水平不断提高。”
对于即将发生的影响,汪洋说:“我相信,你们如果能带着问题去想,带着问题去做,会比我今天讲的所有内容对财政工作有更大的益处,而且不是一天,将会发挥长期的作用。”
在汪洋的推荐下,“大数据”最终进入广东省政府的推动计划中。今年4月份,涂子沛两次广东演讲之行期间,广东省政府已聘请他为“大数据顾问”。
在广东引发冲击波的同时,《大数据》一直列在畅销书的榜单上,被《亚洲周刊》等媒体评为2012中国年度十大好书。有人专门评论说,“在某种意义上,涂子沛的《大数据》在中国起到了一种启蒙的作用。”
为未来而奔走
从4月2日到26日的24天时间里,涂子沛在微博上更新了近14条演讲消息。其中包括在广东电网、深圳华为、中科院、阿里巴巴、上海零点、上海银联、上海人保财险、神州数码、上海闵行图书馆、杭州书立方、暨南大学以及浙江省委和省政府。这期间,涂子沛只花了两天清明假回了趟9年没有回的江西老家,其余时间他大多都在告诉企业员工、政府公务员、高校师生和社会市民,关于大数据与政府、商业和公民社会之间的关系。
每场演讲之后,涂子沛都会在微博上更新致谢和感受。涂子沛写道:“上海的读者当中,既有白发的老者,还有中年的大婶,气氛热烈,问答有序,令人难忘。”
涂子沛一边推广大数据,一边还准备在国内筹建一个大数据公司。在微博、豆瓣等社交网络,有关大数据的讨论、演讲公告以及读后感,在人际传播中不断扩散。草长莺飞的4月里,年已不惑的涂子沛在为大数据四处奔走,穿梭于“北上广杭”等经济先发城市。
在一次演讲中,涂子沛这样说道:“今天,数据已经无处不在,我们的衣食住行、喜怒哀愁、吃喝玩乐都以数据的形式存在。通过数据、网络和软件,我们用数据来记录这个世界,再通过研究数据去发现这个世界。”
在书的尾声,涂子沛专门写下《挑战中国,摘下“差不多先生”的标签》一章。他在文中写到,“中国缺乏收集数据的意识,胡适有一篇文章,叫‘差不多先生’,他说我们中国人是‘差不多先生’,我们不追求精确,习惯于差不多,模棱两可。还有外国人认为中国人是一个漠视精确、思维含混的民族。大数据对中国来说,与其说是一个机遇,还不如说是一个挑战。”
在一整月的演讲之后,5月2日涂子沛回到了美国匹兹堡的家中,在他回美国之前,《大数据》第二版已经推出。涂子沛说:“数据已经成为转型时代的一个新的支点,任何时代的转型都是一个机遇,无论是企业还是一个国家,机遇抓住了就可能成为一个竞争的优势,如果失去了,就成为一个新的落后的理由。”
这场因《大数据》而掀起的“数据旋风”,将给中国政府带来什么样的改变?这或许是一个智慧的考验。