运营商大数据变现为何步履蹒跚?

一、第三条曲线日渐迫切

最近总理的宽带降价提速论,又掀起了一阵针对运营商的批判。近几年来围绕运营商的负面话题此起彼伏,火爆程度远超其他国企。为什么运营商不能像水电煤一 样,既关系国计民生,又在日常生活中隐形,悄悄地过好自己的日子呢?对于这个问题,有人归结为人傻,过度宣传过度承诺;有人归结为钱多,让人眼红的净利 润、数千亿的采购与相关产业链拉动,导致利益相关者太多。

最近微信上有篇文章,从产业的角度指出了问题所在,那就是三家电信运营商承载了一个“过重”的移动互联网产业,该产业对就业以及经济转型的拉动是其它任何行业所无法比拟的,这也是总理关注的最终目的,总理基本不会主动关注水电煤,除非它们出了大问题。

材料力学告诉我们,物体承载过重,导致应力变强,结构变形,不稳定。一个行业也是如此,如果承载过重,压力与指责一定增多,产业链也会进一步裂变,不停地动态调整,直至与之相符的稳定结构出现。

什么是未来通信行业的稳定结构?无法简单下结论,有可能引入更多的竞争者,从供给方面提升服务能力,让渡服务利润;有可能通信业务继续下沉,成为国家管控发改委定价的纯管道。不管是哪一点,对运营商而言,依靠流量的收益/盈利模式越发不可持续,第三条曲线变得前所未有的紧迫。

近几年来,运营商一直探索并向第三条曲线转型,除了政企应用、数字内容外,大数据越来越受到广泛关注,很有可能成为与数字内容同等重要的第三条曲线。

二、运营商数据价值逐渐明晰

对于所有号称涉足大数据的互联网公司而言,可以从两方面判断其前景与价值,其一是否有稳定的数据源,其二是否有持续的变现能力,其中包含数据理解运用的经验积累。就数据获取而言,大的互联网企业由于自身用户规模庞大,把自身用户的电商交易、社交、搜索等数据充分挖掘,已经拥有稳定安全的数据资源。那么对于其它大数据公司而言,目前大概有四类数据获取方法:

第一、利用广告联盟的竞价交易平台。比 如你从广告联盟上购买某搜索公司广告位1万次展示,那么基本上搜索公司会给你10万次机会让你选取,每次机会实际上包含对客户的画像描述。如果你购买的量 比较大,积累下来也能有一定的互联网用户数据资料,可能不是实时更新的资料。这也是为什么用户的搜索关键词通常与其它网站广告位的推荐内容紧密相关,实质 上是搜索公司通过广告联盟方式,间接把用户搜索画像数据公开了。

第二、利用用户Cookie数据。Cookie 就是服务器暂时存放在用户的电脑里的资料(.txt格式的文本文件),好让服务器用来辨认计算机。互联网网站可以利用cookie跟踪统计用户访问该网站 的习惯,比如什么时间访问,访问了哪些页面,在每个网页的停留时间等。也就是说合法的方式某网站只能查看与该网站相关的Cookie信息,只有非法方式或 者浏览器厂家有可能获取客户所有的Cookie数据。真正的大型网站有自己的数据处理方式,并不依赖Cookie,Cookie的真正价值应该是在没有登 录的情况下,也能识别客户身份,是什么时候曾经访问过什么内容的老用户,而不是简单的游客。

第三、利用APP联盟。APP 是获取用户移动端数据的一种有效手段,在APP中预埋SDK插件,用户使用APP内容时就能及时将信息汇总给指定服务器,实际上用户没有访问时,APP也 能获知用户终端的相关信息,包括安装了多少个应用,什么样的应用。单个APP用户规模有限,数据量有限,但如某数据公司将自身SDK内置到数万数十万 APP中,获取的用户终端数据和部分行为数据也会达到数亿的量级。

第四、与拥有稳定数据源公司进行战略合作。上述三种方式获取的数据均存在完整性、连续性的缺陷,数据价值有限。BAT巨头自身价值链较为健全,数据变现通道较为完备,不会轻易输出数据与第三方合作(获取除外)。政府机构的数据要么全部免费,要么属于机密,所以不会有商业性质的合作。拥有完整的互联网(含移动互联网)的通道数据资源,同时变现手段及能力欠缺的运营商,自然成为大数据合作的首选目标。

通信网络作为互联网、移动互联网的应用承载,其通道数据涵盖所有的互联网与移动互联网行为,这些行为数据的解读,为全面解读“消费者黑箱”提供最为完备、准确的数据依据。

传统的消费行为理论认为,用户(消费者)对产品和服务的选择是一个复杂的多种类的竞争过程。用户的购买决策过程是未知的,就像黑箱一样。用户先受到外部 刺激,一方面是经济的、政治、技术、文化方面的不可控的宏观外部刺激,另一方面是产品、价格、渠道、促销的可控的企业营销组合手段的刺激,然后就是一个黑 箱的购买决策过程,之所以说是黑箱是因为真正的购买决策特征、心理是未知的,难以完整、全面的把握,传统经济环境下所看到的实际上是用户选择后的结果或反 应,多少人购买了,多少人使用了,以及口碑或满意情况。

互联网环境下,一切行为都将成为呈堂证供,用户的购买决策构成由未知逐渐变为已知。比如电商消费中,我们能从用户的浏览记录、购物车记录、商品比价记录与最后的购买决策关联,能够勾勒出用户消费决策的过程。甚至链接的来源是搜索广告渠道还是自传播渠道,都能客观的进行评价。

由此可见,作为互联网尤其是移动互联网通道的载体,运营商的数据对电商(甚至所有商家)用户活跃与销量提升具有重要的作用。比如某排名靠后的电商网站, 其会员用户过亿,但真正活跃的不足2成,如果能知晓剩余的8成用户在其它电商网站的行为,其价值不言而喻。同时运营商的位置与行为轨迹信息、实名制导致的 真实身份信息,对征信、精准广告、区域人流量统计、区域商业价值评估都有重要的参考价值,也是目前不少运营商省公司积极探索的方向。

虽然方向已经明确,但以下三个方面的问题让运营商的大数据变现步履蹒跚。

三、三个原因影响运营商大数据变现

第一、当前的数据价值仍未到引起高度重视的程度

对于征信应用而言,2015年1月份央行发布八家准征信牌照大大促进征信市场的发展,越来越多的公司开始涉足关注。但实际上每年200万笔的p2p交 易,其中涉及的征信需求有限,即便加上其它的消费信贷,如果局限于互联网金融,与要承担的风险相比,当前市场需求与价值不足以让运营商决策层重视并下定决 心涉足征信领域。广告领域应用也是一样,目前的程序化投放广告(DSP)本来就只占总展示广告的一小部分,其中的RTB广告在程序化投放广告中又只有一小 部分,其中涉及到移动端的比例就更小。虽然多屏互动效果,移动端的数据对PC端的精准广告也有价值,但实际上能够准确关联PC与手机终端的比例不高,据说 百度相对较高,也不到40%。总体而言,现阶段运营商数据变现的市场价值未能引起相关决策层足够的重视。

当然如果运营商真是如私人互联网公司一样,一定不会轻易错过这样的讲故事机会,哪怕是烧钱,也是振奋市场提升股价的良好题材,影响力超出暴风科技DT战略的无数倍。比如征信的真正应用不在互联网金融,70%或更多的应用将用于信用经济,或者信用生活。

2015年3月份,巴塞罗那通信展上有个北欧小公司KLarna(网上可以查到),是做电商的。KLarna的电商和一般电商不同,用户注册身份后,不 需要关联银行账户,不需要支付宝,凭借的是信用交易,先买喜欢的商品,由KLarna垫付资金给商家,然后在一定期限内,用户可以通过多种方式(包含邮 寄)将欠款还上。其欠费风险控制主要来自大数据,至少你恶意欠过一次后就不会那么方便欠第二次。

第一次听到KLarna CEO的演讲,觉得在中国这样信用缺失严重的国家不可能生存。仔细想一想,其实不然。过去银行给穷学生发信用卡,凭借的也只是一个身份,没有任何可抵押的 东西,就可以给几千的受信额度,实际上这些学生的恶意欠费占总信用消费的比例,一定在一个可以控制的水平之内。在一个个人信用越来越受重视的社会,类似这 样的信用经济一定有广阔的空间,这也是KLarna快速融资数亿美金并受追捧的重要原因。

最近阿里的“芝麻信用”分数与旅行社办理新加坡、卢森堡的签证进行关联,这是信用生活的一种应用形式,其实,更广泛的想一想,目前的拼车、租车如果加入信用评级结果,业务量一定进一步提升,用户体验及保障也会进一步增强。

第二、信息安全是绕不过去的门槛

如果说市场前景可以通过画饼进行预期的话,那么信息安全是制约运营商大数据变现的最艰难的门槛。

2013年7月19日工信部发布的《电信和互联网用户个人信息保护规定》,其总则中明确提出“用户个人信息”的定义“用户个人信息,是指电信业务经营者 和互联网信息服务提供者在提供服务的过程中收集的用户姓名、出生日期、身份证件号码、住址、电话号码、账号和密码等能够单独或者与其他信息结合识别用户的 信息以及用户使用服务的时间、地点等信息”,能够追溯到个人终端的使用服务时间、地点信息也属于个人信息,其采集要遵行必要性原则,起使用要遵行告知并取 得用户同意的原则,而且明确不得泄露、篡改或者毁损,不得出售或者非法向他人提供。

按照该规定,目前互联网上的众多数据采集与交易都在规定的边缘,甚至或多或少存在违规现象。2015年3月华为在巴塞罗那通信展上的大数据解决方案中,专门有一个模块,满足防守条款要求,也就是允许客户选择公开或关闭个人信息(或某个部分的个人信息)。

如果严格按照该条款,任何能够关联到客户号码或终端的个性化精准广告推荐都是行走在边缘地带,虽然以画像或标签化方式能够规避其中的部分风险。中 国电信在大数据应用上走得较领先,也把安全性原则列在开放DMP业务规范基本原则第一条,如“进入大数据能力平台的用户属性数据与行为数据必须脱敏,脱敏 数据不得包含能够直接或与其他数据关联后可间接追溯真实用户信息的内容”,但实际应用中,如果不能关联到用户终端,如何应用于RTB实时精准广告推荐?

受该规定的影响,任何能够追溯到个人或终端的数据变现应用,与第三方进行变现合作均存在不可预料难以管控的风险。即便是经过用户授权同意的征信应用,往往蹦出一例安全事件(合作方将数据应用在非合作应用领域),媒体放大后就会成为运营商不可承受之重。

从未来的趋势看,即便大数据应用专家呼吁新的数据伦理,但关系到个人信息保护,其规定只会越来越强。国外运营商之所以少有大数据变现成功经验,大多受此 制约。如Verizon的Pricision Insight服务,跟合作方共享面向商场、体育馆、广告牌业主等特定场所手机用户的活动和背景信息。因为只有2%的用户愿意提供自身信息,实际应用价值 大打折扣。

第三、端到端变现能力不足

如果运营商能和BAT一样,有自己完整的端 到端变现能力,比如独立申请征信拍照并推广征信应用,比如独自经营广告业务,如广点通、阿里妈妈、百度一样,独立的广告变现渠道,所有的用户数据流转在自 身的体系内,那么一切风险都变得可控。因为对外提供的是评分结果,是推荐的广告内容,而不是用户的行为特征数据。

但问题在于,BAT是先有变现渠道,后有大数据应用,就如先有微信用户群、先有朋友圈分享,后有精准feed广告一样,数据变现渠道是一项直接到达用户的核心能力,并不是简单投入就能获取的。

说到这儿,感觉有点憋屈,运营商的大数据就如蒙古国的煤矿与稀土一样,自身消化不了,只能靠卖给中国或通过中国的火车卖到海外,才能实现价值。

除了变现渠道之外,还有一项变现能力存在不足,该能力与运营商自身密切相关,那就是面向应用的数据理解与模型应用能力,该部分能力其实更为重要,更需要持续的资源投入。

目前的问题也在于此,一方面需要资源投入锻炼数据理解与模型应用能力。 这里特别强调面向真实应用,因为脱离真实应用的研究性投入并不能给实际数据模型能力提升产生多大帮助。比如对上网日志的解读,只有针对具体的应用场景,才 有可能对某些电商网站的行为对应的URL代码进行深入爬虫分析。只有参与到征信模型及应用中去,才能检验想象中的影响因素与真实情况的一致性,比如打电话 多的其综合信用评分可能不是更高,而是更低。另一方面缺少外部合作,较难理解真实数据需求,同时缺少变现收益来支撑持续资源投入。

四、合作试点是解决之道

虽然步履蹒跚,但广阔的前景仍然吸引运营商省公司积极探索、大胆创新。受去年上海踩踏事件的影响,目前面向政府、旅游部门的区域人流量统计与告警应用如火如荼,并逐步向其它应用领域积极探索。

在数据分析方面,有一个很老的拇指法则:数据分析工作有70%-80%的时间花在收集和准备数据上面,仅有20%-30%的时间花在分析本身上。在刚开 始处理大数据时,这个比例估计会更低。确定大数据中有价值的部分,并确定如何最优而精确地提取这些部分,非常关键,其实这也是探索并优化应用模型的重要过 程。

大数据公司通常定期展示一些洞察报告,就是边理解边实践的一种良性循环,不管这些洞察报告多么微不足道。这些不定期的洞察报告一方面让人们保持这一过程的兴趣,一方面不断探索数据应用领域与价值,不断完善既定的应用模型。

就如站在河边学不会游泳一样,大数据变现应用实践比什么都重要。否则空对着自身的数据通过想象的方式去研究,无法真正锻炼变现能力。在当前缺少变现渠道的情况下,与有限合作伙伴在一定范围内的试点才是正确的解决之道。

;