隐私可以卖钱吗
——大数据时代的交易恐慌
⊙记者 于斐 ○编辑 王诚诚
某无聊路人甲精心整理了自己三个月事无巨细的网络浏览记录,具体到鼠标轨迹,屏幕定时截图,再到键盘输入记录。这位路人甲以此收集统计了一个大约7GB的数据包,其中有280万行文本信息(相当于1500本书),软件记录的鼠标点击次数75.5万次,电脑摄像头自动拍照2.1万张图片,GPS记录行走距离1.9万英里,总之是卷帙浩繁,博大精深。现在路人甲说这些所谓“隐私数据”是卖钱的,便宜了还不卖。
这不是一个冷笑话。 美国人Federico Zannier一直觉得自己努力上网,贡献社会,养肥Google,自己却一分钱的回报都没有实在是一件大不公的事;所以他从今年2月份起开展了以上路人甲计划。目前Zannier已经在kickstarter众募网站上开卖了,捧场的人还不少,截至14日,这7GB数据已经炒至1100美元,马上就要赶超一盎司黄金的价格了。
写到这儿,有几个问题已经明了:在全民互联时代,你可以免费浏览网页,免费下载音乐,免费查看他人的隐私,但这种免费却同时也是耗价不菲的,你的隐私同时被各大数据采集商收集整理并商业化。这里用隐私这个词可能有误导作用,因为我们并不一定将所有的行为都归于隐私的范畴,但是无论如何这种行为数据是真实存在的,而且产生的价值很可能比我们想象的多得多。
早在前两年,就有分析师注意到在google搜索中关于房屋买卖的搜索数量与经济走势直接相关,比一般的宏观预测模型都要准确,显然,搜索引擎比“老大哥”还“老大哥”,因为他们不仅监控而且还正确预测,精准投放,然后数钱。在这样一个互动的过程中,众网友其实是在用隐私换服务,Zannier的逻辑就是“我的隐私比他们提供的服务值钱”。这样的论点能否成立是一个高级统计学问题,无法解答。但可以肯定的是,在不远的未来,我们将没有隐私。可这并不意味着我们会因此全知全能,将信息尽在掌握。相反,这种数据的堆积很可能把我们带入一个新的“群氓”时代。
对于金融业来说,分辨噪音将是(本来就是)一件难上加难的事。现状和未来将是信息无处不在,真相却有很多个,而每一个都有一群狂热的粉丝摇旗呐喊。
自我验证最早是一个社会心理学理论,近来在行为金融学中也颇受关注,简单地说就是人们一旦有了某些想法,他们就会努力寻找各种论据来证实这种观念。具体到金融交易上,如果人们认为某只股票一定会涨,那么任何轻微的震荡上行都会让他们追加投资,而如果这种行为达到一定规模,自我验证就变成了自我实现。
通常的观点是信息时代扩大了我们的视野,在互联网发展的早期,这应该是正确的。不过在目前,互联网很可能起到逆向的作用。大数据的诱惑让各大互联网服务商力图做到精确定位受众,挖掘需求。这样做的结果很可能就是你今天的无意搜索了一下“切糕”这个关键词,然后就收到了无数关于切糕的推送,切糕的原理,切糕的制作流程,提供切糕的厂商等等,这种阵势很容易让你以为这个世界不是我的,不是你的,而是切糕的。而我们也就是这样在一个信息爆炸的年代慢慢变得狭隘的。圈子可能大了,但是观点反而少了并且两极化。致力于寻找热点的金融分析师也因此而轻易地误入歧途。
分析师从来就热衷于寻找各种相关性,从最基本的资本市场线CAPM到高端的矩阵实验室,量化投资的追随者一直就致力于在数据中找关系。但正如纳西姆·塔勒布(Nassim Taleb, 《黑天鹅》作者)提出的,随着数据的增多,统计上显著的相关关系也就越来越多。而正如切糕不是世界一样,这些关系很多也是没有实际意义的。欺骗性的数据不仅会让我们误入歧途,而且还会带来不实的安全感,雷曼兄弟就是这样倒下的。而数据愈多,要筛选出有用的那根针就更加困难。大数据对于交易来说很可能是大噪音,对于要想找到节奏的投资者,大数据不是什么福音。
后大数据时代不用占星师,我们也可以知道一个人的过去未来,误差不会太大,但是以亿计的小小误差合起来就会是一场海啸。也正因为此,某些朴素的投资理念永不过时,比如坚持投资你所熟悉的行业,不盲从,不冒进。不过,华丽的大数据将会使这样接地气的投资越来越难,越来越少。
最后,提供笑话一枚,英国保守党宣传部负责人某天惊讶地发现工党网站上居然有应召女郎的广告,大为兴奋,立即开始宣扬工党已经穷到要拉特殊服务的广告了。不过工党面对这个诽谤不但不反驳反而各种欢天喜地,还友情转发了一份谷歌广告条原理链接……
你没有笑?好吧,这是一个冷笑话。