大数据江湖的七十二骗(上)
前两年,Peter Thiel(以下简称彼得)来了一趟中国卖书——如你所知,就是那本《从0到1》,和《失控》一样,目前基本上成为了互联网行业骗子人手一册的玩意儿,类似《麻衣神相》《水镜全编》,或者干脆叫《如来神掌》也无不可。BTW,彼得是个有私人飞机的亿万富翁,按说瞧不上那点儿版税,不辞劳苦跑到中国做签售,其实主要是借书来拓展行业影响力——这既是当代媒体社会的本质,也是深谙“话语权”玩法的常见手段。总之,蒙友人赐票,我瞻仰了彼得接见互联网创业青年们的大会,我觉得这人书写得虽然杂乱了一点,上了台说话倒还比较实在。后来,读到他说搞“大数据”的人里骗子居多,也就不太奇怪。
按说彼得本人就投资过数据领域的公司,而且投的还挺成功,就是那个Palantir,这事儿其实有点微妙(关于Palantir我们将来再聊),和彼得那句话再一联系,基本上也能对国内“大数据”投资这把虚火有一点洞见,大意来说就是:
不要对“Big Data”这件事抱什么期望,尤其是不要用这种期望去指导你投资的估值;
数据并非没有价值,但你去投资一家所谓Big Data的企业时,核心问题是企业的商业模式,而并不一定是看它有多少用户和数据。甚至在中国的环境下,即便数据的“成色”非常好的企业,也可能隐含着各种各样的坑;
千万记住:张嘴说自己是“大数据”行业的人,请先给他个有罪推定——这行儿骗子多,哦对应着最近出的那个2016年度“中国大数据创新百人榜单”,各位可以自己联想。
一般来说,这一行儿的骗术不外乎如下几种手段:
最高级的,当然是直接搞政府的钱。
比如说,本人曾参观某企业为某县级政府建立的“大数据中心”——你一进去先请你进会议室座谈,铺绿呢子的台面儿上每人一个印着名字的桌签儿,一个烟缸儿(信息量很大的一点,至于为什么,自己去品。品不出来的打赏10块找我解答),一个白瓷茶缸子(我经常依靠里面沏的什么茶来判断一会儿该往哪种路子扯淡),一个热手巾板儿,一份打印好的项目资料——翻开一看不留神以为是党章。座谈基本上是颂圣,然后众人被鱼贯押入演示大厅,有身披红色礼仪绶带的女讲解员激情讲解(大概率除制服外脖子上还系着领巾如空姐一般),大屏幕上出现各种当地的航拍View,并各种互联网Icon纷至沓来,其空洞和乏味程度,让你怀疑自己在参加一场平庸的婚礼——从主持到视频制作的逻辑都是一样的。好不容易进入到业务演示环节,你发现所谓的大数据系统就是一个政务OA,几台民用级服务器搞定的项目,用的是大几百万的IBM或者富士通,而每年的服务和维护费用可以高达千万以上。
我见过最蛋疼的一个政府“大数据”项目,是某地的一个水利监测大数据系统,大概就是给当地几个主要的水利枢纽装个摄像头和监测传感器,每天更新当天的水文数据。这事儿我觉得给我十分之一的项目预算,我雇五六个当地老头儿拿了画上标尺的竹竿儿,每天溜达去探几次也就搞定了,估计剩下的钱还够我在北京卖套小小的学区房。
千万不要因此而鄙视天朝的行政制度,作为这个时代情商水平最高的一个群体,此类项目的政府审批官员们未必不晓得个中奥义,也请不要简单的以灰色交易来看待此类项目,因为现在的反腐形势下,此类政府项目的做法已经不那么简单,背后的博弈套路可以单开一文来细说,此处不表。
另外一个常见思路,是搞投资人的玩法。
所谓的投资人,其实早已经从以前还算decent的一种职业变成了江湖掮客,靠规则/圈子/信息不对称来骗钱,这个群体目前最大的一个特征就是“不要脸”。当“不要脸”成为从业者的核心能力时,其结果就是拉低整个行业的教育程度和智商门槛。更何况VC行业普遍的2/20结构其实并不一定适合中国的国情,加之监管环境的不严格直接导致了投资人们“体外变现”的动力,这进一步拉低了整个行业的专业水准。简而言之,相当一部分的国内科技领域投资人都存在着知识结构的硬伤,虽然现在拿投资已经是越来越困难的一件事,但是辅以巧妙的设计,“大数据”行业的乡亲们仍然有机会:
一、一力降十会:
这种打法适合套取来自“土豪”们的资金。一旦发现对方来自国有资本,或者来自一些传统行业的民企(老板早年靠改革东风发财,在制造业/房地产/小煤窑儿走向下坡时寻找转型机会),建议一上来采用这个套路。此类土豪一般都是逆周期者,即往往在某个领域被喊得最热时冲进来当接盘侠,来做洽谈或者尽调的人也大多是“一门没有”的血外行。他们的全部本领就是读了本文开篇列举过的那几本《麻衣神相》,并且学会的一定是其中最最土鳖的部分。在洽谈时要留意听他们使用的词汇,你像“场景”,“革命”,“零到一”,“共享经济”,“风口”,“降维攻击”(作为一个读过一点量子力学的清华人,我觉得这个词太过于sb,在本表格中给予最高权重)….之类,这些词汇如果以平均每三句话出现一次的频率出现时,请记住将你的估值报价加倍。
具体到大数据这个领域,你只需要强调“大”就可以了,诸如你的系统一天处理多少个TB的数据(放心,他们并不懂得这些数据到底是淘宝的交易数据还是日本动作片),影响了多少人的生活,在某个细分行业里占据了多大的比例,举一个极端的例子:你可以宣称自己在全中国的公共厕所里安装了免费WIFI,根据用户在蹲坑时候刷WIFI的时间判断他是否便秘,从而精准定位到一些潜在的痔疮患者,你的潜在投放客户有“北京市东大肛肠医院”以及“马应龙痔疮膏”等等….细节稍微脑补一下即可,此类“投资人”需要的故事也就这类水平。
个别的此类低智投资人可能花钱读过EMBA(关于EMBA的梗请参见本人前一篇匿名文章《互联网+拯救不了强哥奶茶的品味》),所以也许他们知道一个叫做SWOT的缺德玩意儿,当他们照本宣科质疑你在公厕里安装WIFI这件事不足以构成竞争门槛时,你可以立刻宣称自己搞定了卫生局和基层掏粪工,这是一个类似于地推能力和政府关系的细活儿,这就是最强大的竞争门槛云云。
我曾经陪同某此类基金的所谓投资人见识过一个公司,该公司宣称拥有全中国的小店铺数据,而获取数据的门槛就是两轮融资后(也不知道是哪儿的倒霉投资人给的两轮融资,你就是洗钱或串通创始人骗钱也选个靠谱一点儿的啊!)烧钱雇佣几千个兼职大学生去扫街抄取各种路边烟酒店的上货/价签等信息。当创始人把该公司CTO叫来自信满满的给我们演示该公司强大的系统时,我发现这个CTO就是个前端,行业经验目测不满五年,而且,他连什么是Hadoop都不知道...
二、四两拨千斤:
人傻钱多的投资人毕竟是稀缺资源,何况只要不太傻,被骗过两次也就不上当了,这时候你单靠“大”就不够sexy。因为你大人家也大,你再大能大过BAT的数据量么?数据量的大小好比女孩子的胸围,您现在喊个D-cup似乎也算不了什么,君不见香港狗仔频频用“G奶师太”之类的词汇么?融资和媒体一样,是个博人眼球的活计,而投资人们很快就对规模这个指标疲劳了。
这时候,就要有一些其他的包装技巧,起到四两拨千斤的效果。好比相亲时你说这姑娘不单是前凸后翘,还出身于神秘的家族,对方待要详细追问时,务必要语焉不详,暗示个中奥妙不便明言,同时给对方一个意味深长的微笑。具体到大数据这一行儿,比如说你声称自己能搞到某些独特的数据源。就我所见过的路数而言,按其神秘程度排序计有:
国家安全局数据(这事儿除了查东突份子,看不出有啥实际用途);
国家工商总局数据(大部分工商数据都是公开可查的);
各类市政服务数据(可能是想根据用户煤气表的数据判断这家人每月在家吃几顿饭,打个标签儿卖给鲁花花生油?);
某省医疗病历数据(这么敏感的信息你丫敢商业化么?卖给保险公司?)
一般来说,此类出来骗钱的公司,早年可能都是干软件系统,弱电项目之类起家的,老板当个包工头儿,靠男的夜总会女的LV这一套承包一些政府小工程,靠着契而不舍任劳任怨的精神进入一个年流水几百到一千万的生意里,苦哈哈干了几年,账期又长还面临政府耍流氓的风险(前任领导走了,后任领导翻脸不认帐),突然发现风口一来,自己给政府干的“信息化”项目成了“大数据”了。
作为系统的后台维护和管理方,这类公司往往能从后台看到一些数,给投资人路演时现场调取一下你的交通违章记录之类,着实能唬住一两个土鳖,当你问到他们数据使用的权限或者“合法性“问题时,往往就开始语焉不详,或暗示这是一个灰色地带,法无禁止。胆儿大些的喷一些联合运营之类的鬼扯(你和政府联合运营?),胆儿小些的说数是政府的,但“我们能用”(怎么用?什么范围用?有无协议?)。
明眼人可以看出来,这类公司玩的也仍然是政府等垄断资源的路子,和第一种直接向政府骗钱的区别在于,这类公司骗的是“数”,骗完政府骗投资人,骗完投资人回去再骗政府。譬如,某个以“幂”为名称的公司,本人曾在该公司创始人未发迹时与其有数面之缘,这位仁兄当年以给企业做上市材料起家,挣得是个copy/paste加装订费的辛苦钱,后来开始帮人家做“战略咨询”和“市值管理”(看过Wallstreet第一部嘛?想想主角为啥冒充收废纸的?),此公除了胡扯八道,对真正的咨询或M&A并没什么认知,所以一直半死不活,直到“大数据”的风口来临,摇身一变成了忽悠政府大数据的商业领袖。
也正是这位商业领袖,上个月我巧遇某拥有部分垄断行业数据的中型国企,被其忽悠成立“合资公司”,事儿过去半年多,估值据传已经数十亿的幂公司,区区数百万的投资款迟迟不能到账——反正这个小故事已经讲完了,签约仪式已经弄过了,投资这事儿那就再说吧。哦对了,幂公司在某轮融资时,某投资人微信问过我的意见,我直截了当的回复称该公司纯是个骗子。
另外,此类公司在实际变现能力上有时难以说服投资人,因此常见的手段是“落地”(落实到房地产行业),即迎合政府好大喜功的心态,以“大数据基地”,“大数据产业园”为名,套取政府土地资源和政策配套。
扯得有点儿长,过两天,再写一写“大数据”生物链中的高级捕食者,即怎么忽悠红杉/高瓴这个级别的投资人,或怎么忽悠上市公司。
欢迎加入本站公开兴趣群
软件开发技术群
兴趣范围包括:Java,C/C++,Python,PHP,Ruby,shell等各种语言开发经验交流,各种框架使用,外包项目机会,学习、培训、跳槽等交流
QQ群:26931708
Hadoop源代码研究群
兴趣范围包括:Hadoop源代码解读,改进,优化,分布式系统场景定制,与Hadoop有关的各种开源项目,总之就是玩转Hadoop
QQ群:288410967