说说大数据变现(1):大数据两类变现
大数据变现从目前我的理解大致分为两类:一种是从抓数据,到处理,到提供最终服务一条龙打通型,百度搜索这种就属于这种情况。另一类是本身没有数据,但是卖数据处理和服务能力,例如teradata,Palantir,其中后者最近的估值已经达到200亿美金。
我大概会分几期内容来说说我对这个领域的理解,主要目的是鼓舞做爬虫的工程师们,做好本职工作,抢好篮板球。
首先,我们说第一类变现,这类变现方式通常需要招募相当数量的爬虫工程师,确保数据获取的成本足够低,数量足够大,及时性足够好。还有一些企业,本身抓取能力不够,会进行数据采购,这类公司主要是广告公司,内容产生型公司,一些需要做推荐系统的公司。这类外部采购需求会让一些江湖上做爬虫的队伍受益,比如我的队伍。
通常这类外部数据采购又分为三类,一类是一锤子买卖,就一次性抓一个站的数据,比如百度知道,马蜂窝等等,谈好一个价钱,在指定的时间内,抓完交付即可。第二类是长期服务,比如微博,微信,百度贴吧等等,因为这些站点的数据每天都会产生大量更新,需要一个长期稳定的数据服务,这种一般按服务时间付费。第三类是数据交换,彼此不付费。例如你有微博2亿用户,我也有2亿,互换,这种相当于数据储备通过互换的方式扩大,彼此成本很低。
当然能实现数据买卖需要很多条件,现在贵阳似乎有个大数据交易平台,但主要是一些高大上数据的交易,一个符合大多数企业,特别是中小型企业的数据交易需求的交易平台特别重要,目前看还不现实,这个我们下期再分析原因。
(完)
网友来信
网友A:感谢梁总近期分享的关于爬虫的文章。如果有个线下交流就更好了,我一定带兄弟们过去。
答:我是打算组织首届世界爬虫大会的(爬虫工程师目前还没有自己的技术大会。。),但需要一个有魄力的企业支持经费,CSDN有兴趣,估计他们内部还要协商下,如果举办,我会及时通知大家的,肯定是免费的。
其他常见问题
Q:如何在pennyjob投放广告
A:我们暂时只服务码农的找工作需求和熟人的招聘告发布。请找工作的码农联系:pennyjob@qq.com 发布你们的求职信息,永久免费。
Q:本栏目担保的靠谱服务有哪些
A:详见:http://assurances.pennyjob.net/