“大数据”是一把双刃剑

2013年12月25日13:01  新闻专栏  作者:魏英杰  

  大概是为了推广手机淘宝的“生活圈”功能,淘宝网近日公布了一组“奇葩”数据:

  国内最爱吃鸭脖子的生活圈是杭州市的日晖新村,这里全年共花费6万多元买鸭脖子;

  最“重口味”的生活圈是位于镇江市的花山湾生活圈,这里用户一年买了5000多个榴莲;

  过去一年暨南大学的整个生活圈一共购买了1万多箱方便面,整体支付金额接近150万……

  这真是一件奇妙的事情。打开手机淘宝,就可借助地理位置和收货地址,鉴定自己所在生活圈的网络消费特征。这之所以成为可能,应是拜“大数据”技术所赐,而在以往,用户数据均为商家(平台)掌握,视为“核心秘密”。当然,淘宝网开发或者说开放这项功能,一方面固然迎合了消费者的“八卦”心理,另一方面,却也是为了创造出更多消费需求。

  但这么做却又是一件非常冒险的事情。这种做法不仅会遭人质疑,搞不好还可能惹上麻烦。上面披露的数据还不够劲爆,下面这些数据也许会让人在大乐之余生出些许担忧:

  我们正在前往性福生活最和谐的生活圈,温州XX大厦,全年共花费3910448元买TT(安全套);

  温州龙湾区XX路附近,全年人均购买25380元情趣内衣;

  宁波海曙区XX家园,人均年“淘宝”消费金额达2.8万元以上,是目前国内在淘宝上消费“最土豪”的小区;

  义乌XX二区全年共花费2973939元买Bra(文胸),是中国2013年Bra消费量最大的生活圈;

  杭州XX新村全年共花费9636426元购买金条,是中国2013年金条消费量最大的生活圈……

  不能再转引了,否则满屏都是XX。这些XX是我打上的,淘宝网公布数据时并未进行技术处理。我为什么这么做,读者应该能够理解。你说这个小区喜欢吃鸭脖子也就罢了,另外这组数据却可能让身处该“生活圈”的人浑身不自在。假如我住在其中一个小区,平时既不买TT也不买金条,甚至不知道淘宝是什么东东,有一天同事却走过来调侃:你们小区买那么多TT(金条),是不是也有你的贡献?这时候,我该作何感想?

  是的,淘宝这么做,哪怕没有违反什么规定,也会让人感觉被冒犯了。这种针对一个群体的生活信息披露,等于把该群体所有人都送到了聚光灯下。淘宝是否有权公开类似信息,能不能这么公开,显然是一个不可忽视的问题。

  何况,即便这些数据不会有假,结论也是非常可疑的。一座大厦花费391万元购买TT,这是什么概念?按照每只TT价格3元计算,这意味着大厦全年消费TT共计130多万只。“臣妾做不到啊!”而据媒体实地调查,这座大厦为商住两用楼,住户仅180户。可以肯定,大厦产生巨额的TT交易量,与住户“性福生活”完全没有关系。发生巨额消费,既有可能因为小区里驻有淘宝网商,也可能只是有人在收货地址上填写了该地址。(或许意识到这一点,淘宝网页面已删除TT相关数据)上面提到的其他事例,也可以此类推。

  淘宝的数据库无疑很强大,一旦有需要,它可以精确无误地统计各种消费数据。小到你在淘宝买了什么,花了多少钱,大到一个地区的淘宝交易量、消费特征,都能够直观、及时、准确地呈现。这正是“大数据时代”的魅力所在。大数据就是“全部”,它不需通过抽样问卷调查,不需要人工计算,便可还原一个社会的运作痕迹。但正如《大数据时代》作者维克托·迈尔-舍恩伯所揭示的,在“大数据”面前,精确度、因果关系不再是最重要的追求,关键是探索事物之间的相关性,发现其中的潜在价值。

  淘宝网公布这组数据,由于仍然延续传统的逻辑思维,再加上试图从中得出迎合营销需要的结论,结果破绽百出,闹出了笑话。可以说,这是一个失败的“大数据”运用案例。这个案例也暴露出“大数据时代”的一个隐忧:只要你在网上活动,不论是搜索、浏览、购物还是别的什么,都将被“记录在案”,而且不知什么时候会以何种方式被人抖落出来。更悲催的是,除非运营商自我规范,否则目前用户无从对此说“不”。

  “大数据”是一把双刃剑,如何才能既得其利又不受其害,这已经是必须面对的问题。

  (声明:本文仅代表作者观点,不代表新浪网立场。)

文章关键词: 淘宝 数据 小区 消费

分享到:
保存  |  打印  |  关闭

推荐阅读

热文排行