译见:给大数据创业者参考 美国10种优质数据服务

亲爱的企业们:我们已经交出我们的隐私,这样的话,那么就请你们用你们的技术以正确的方式服务我们。

我真心的相信,如果我们能竭尽所能地获取数据,那么这些数据将使世界变得更美好。竭尽所能获取尽可能多的数据,不可避免的带来另一样东西:透明化。虽然我对那些为隐私而斗争的人们敬佩不已,但是,隐私和《第四修正案》已经名存实亡(即《美利坚合众国宪法第四条修正法案》,是美国权利法案的一部分,旨在禁止无力搜查和扣押,并要求搜查和扣押状的发出有相当理由的支持。该法案于1792年3月1日正式被通过,早起其适用范围限制在执法人员对私有财产的实际侵扰上,后来延伸到保护个人隐私上。译者注)。那个“神秘的人”将会一刻不停地监视,并将搜查和逮捕合法化。而我们普通民众也享“受着”科技进步带来的好处,就像《1984》中的监视状态(该书为英国作家乔治·奥威尔1948年创作的一部政治讽刺小说,于次年出版。

书中讲 了一个令人感到窒息和恐怖的,以追逐权力为最终目标的假想的未来极权主义社会。三大国之一的大洋国的领导者“老大哥”,有着“老大哥正在看着你”的标语,并在街景中明显出现。政府通过一种叫做“电幕”的双向电视,既可以向公民传播影像,又可以用来监视公民,而且是在私密和公开的场合都可以。译者注)。

我们常常可以听到有人说,有些公司寄给自己的产品好像让人觉得他们非常了解自己,这让我们感到极其不舒服而且心生恐惧。但是当这些公司显得不那么了解我们的时候,我反而常常感到惊讶和苦恼。他们明明就应该为我们提供便利。我这种心态最好的解释,也许是Dead Kennedys乐队的那句话吧:“要么给我便利,要么让我死”(Dead Kennedys是1978年组建于旧金山的硬核朋克乐队,《Give me convenience or give me death》是他们1987年出版的一张专辑。译者注)。

我上周写道,在应用机器学习的过程中,想象力的匮乏会导致我们对现实中的一些重要问题束手无策。这周的文章中我会列举十个实际生活中的难题。如果那些科技公司在利用数据时,多站在客户的角度上进行思考的话,这些难题则可以被轻松地解决。

解决方案No.1:关于航班延误与再规划的简单规则引擎

全美航空和美国航空两家航空公司在处理由前一班飞机晚点造成的转机误机时,做不到为旅客重新订票。而达美航空公司不仅能判断出这种情况的出现,而且还能为旅客重新预定转机机票。不过,代价是额外的两次转机,以及比原计划晚一天到达最终目的地。当然了,如果想要争取一个不至于太糟糕,且能配得上已经错过的班机票价的行程,那旅客仍需给达美航空打电话争取。但达美航空最起码判断出了旅客会因为前一班飞机晚点而错过转机。这甚至都算不上是机器学习,只是简单规则引擎加上搜索产生的信息。

解决方案No.2:社交网络上的语义分析

万豪酒店并不知道我在Twitter上的推文里对他们的评价是好还是坏,也有可能略显滑稽。

我住万豪时,给了服务生20美元的消费,因为她打扫的相当不错,只是厨房有点乱。可是这个服务生很可能收到了领导的批评,因为我在Twitter上对她的评价是“不可多得的好”,而万豪的语义分析对我的评价理解有误。不过万豪解释说,是名为“贾宁斯”的人因为读的太快,误解了我的评价,而不是电脑程序。

在社交媒体监控方面,为什么好多公司就连初步的语义分析都不利用一下呢?当然这些公司会雇一些人来纠错,因为我和朋友们经常恶搞这类程序,让他们的判断笑话百出。但是自然语言处理和语义分析的发展历史已然不短了。这些公司至少可以把推文字体加个颜色,以便分析人员阅读吧?顺便普及一下,这一点 TweetDeck就可以做得到。

解决方案No.3:衔接航空公司与租车公司间的简单网络服务

Hertz(美国租车公司)与多家航空公司都有合作,但是这些航空公司都不会把我的航班信息与赫兹共享。这当然要经过我的允许。但是在航班行程有变这件事上,我对租车公司有什么好隐瞒的呢?实现这种信息的互通,只需要一项网络服务,或者简单的信息发布与接收就能做到,这其中有可能要建立一些标准。不过要远离那些表面上的网络工作者,他们写不出实际的软件,只会在学术上废话连篇。

解决方案No.4:保证消费者汽车不会没油的同步服务

Waze(导航软件,译者注)和Automatic(一款汽车辅助应用,译者注)之间没有任何接口。当你的车没有的时候Automatic是知道的;通过Waze用户可以找到最近的加油站;Google可以告诉你那家加油站的营业时间。

不过Waze也是Google的另一款搜索功能很差的产品,就像永远都那么讽刺的Google Docs/Drive 套件。所以Waze也有可能根本找不到加油站。

仪表盘上的油量指示灯有时不能吸引足够的注意力,所以我希望我说的手机也能以某种方式提醒我,可以是简单的信息,搜索或事件。

解决方案No.5:利用简单的机器学习工具来判断饮食喜好

Caviar外卖公司又一次希望我想要点奶酪披萨,就开始向我做推荐,原因仅仅是是我曾经在纽约点过外卖。可是我那次点的明明是素食,而且我也在旧金山点过他们的外卖。Caviar可能知道我只在纽约停留了几天而已,所以他们也应该知道我不喜欢吃披萨。他们完全可以开发一个自己的推荐系统(例如,其他搜索素食的顾客还搜索了什么,或者他们从来没有点过什么)或者一个利用机器学习的分类器(例如发现素食者从来不点奶酪披萨)。

解决方案No.6:医疗记录显示应用

我现在正被困在候机厅里,不过我讨厌在医院等我的医生。首先,我知道在我等待的同时,医生也很忙,可是医院为什么就不能给我一条明确的信息告诉我还要再等半个小时呢?这只是一个简单的趋势分析。

其次,基于目前我的跟腱所接受治疗的情况,我自己都知道现在唯一可行的疗法就是注射血小板血浆。医院为什就不能利用一下规则引擎,让我通过一个 app来回答那些基本的、重复的、脑残的问题呢?为什么非要让我去一趟医院,来做这些呢?使用这样的app后我也可以认为我已经看过医生了,我不想浪费大家的两小时宝贵时间,我也愿意支付同样的费用。

利用简单的自然语言处理以及规则引擎技术,绝大部分的基于病史询问的初始评估都可以完成。实际上,利用一组由Google Forms组成的问卷树,可能将以病毒感染为原因的就诊量减少一半。患者可以去CVS(美国一家连锁药房便利店,基本都设有诊所。译者注)或者不繁忙的诊所量个血压,然后将测量数据进行传送。根据进一步,有同样分析结果的患者很有可能可以接受方法相同的治疗。这会很明显的提高效率,正如美国的医疗保健“系统”一样。

解决方案No.7:“共享经济”中的喜好匹配

Uber应该大力开发司机与乘客的匹配功能。在人口密集的地区,对司机与乘客间展开多方面的匹配是很重要的。例如,如果能给一个抽烟的司机匹配一个表示“不在车里抽烟”的烟民乘客的话,司机的服务会更令人满意。那么我是想说,如果Uber继续挥霍用户隐私的话,也请稍微向交友软件借鉴一下吧。很多信息都可以分析出来,比如某个用户为了等待一个符合条件的人出现,愿意花费的时间。这可以通过一个基本的推荐引擎,甚至更简单的搜索来实现。

当然了,更炫一点的图谱搜索可以让我知道,好友的好友作为一个司机口碑如何。我们也不能指望所有的Uber司机都能谨慎驾驶,都不抽烟,都保持良好的车内环境。要知道这都是叫出租才有的体验。出租车司机有时候还边驾驶边发信息呢。

解决方案No.8:利用语义分析提前预测公司的收益情况

我最近试着运行了分布式蒙特卡洛模拟,也参加了Elastcon大会,在会上美国地质勘探局说明了他们是如何通过Twitter来检测出地震的。在对以上两件事的思考中我意识到,通过利用语义分析和社交图谱搜索,我们很可能在某家企业发布其收益报告前获知其收益情况。

大体上,我们可以去观察那些身居公司高层的人是不是心情很好,还有他们的配偶、助手,包括他们的孩子。那他们在社交媒体上表现出的高兴成都与公司上季度业绩怎么相关联呢?在我看来,CEO在社交媒体上的资料或者言论都是被公共关系所限制的,但是与高管层走的很近的人,非常可能通过自己或与周围人的社交媒体,透露出高层们或高层周边的人的喜悦之情。我敢打赌,在公司收益报告公布之前,你完全可以根据我的分析完成正确的交易。有一天我在Google上发现早就有人在做这件事,在这之前我一直以为我在这方面天赋异禀。

解决方案No.9:披萨推荐中的定位应用

我总是试图让自己的胃在旅途中不受到亏待。于是乎我住的酒店房间一定要配有厨房,并带着我的厨房用刀。但是通常的情况是,在一整天对数据的辛苦挖掘之后,我回了酒店倒在床上就不想动了,然后拿起电话点披萨。披萨店的点餐软件知道我不是住在家里而是在酒店,有可能是因为我当天没有去生鲜超市而只是在办公室和酒店之间往返。而且这软件还问我是不是仍然想吃上次住酒店时所点过的披萨。这就是一种实时地理定位加上提示推送的服务。

解决方案No.10:用以分析顾客喜好的历史购买数据

当我从外地回家的时候,当地的Harris Teeter杂货店总是为我选一篮子我最近一次在他们店里买过的有机产品。他们也应该知道有时有机产品卖光了,我也是会买点喷过农药的产品的。这就是顾客历史购买信息、推荐、定位技术,也有可能是同样应用于他们自己库存的趋势分析技术。仔细想想,这些商家从几年前就开始以“折扣”作为诱惑,来换取我们出卖自己隐私的签字,他们怎么可能没有数据拿来对我们的购买倾向作分析呢?

现在的情况是,我们早就开始用自己的隐私来交换无缝的网络接入服务、导航服务,还有所谓的折扣。那些数据的主导者们也该开始为消费者的便利着想了。国家安全局铁定在我吃晚饭前就知道我将会吃些什么。那么为什么为我具体服务的饭店或者杂货店就不知道呢?

对于你们这些企业,如果你们连如何使用顾客数据的想象力都没有的话,那你么收集这些数据做什么呢?你们肯定知道我现在身处何处,也知道我正在做什么。且行且抚琴(Dead Kennedys乐队的著名歌曲,译者注)!

End.

;