探秘国内地下数据交易市场

如果有一天,别人通过你的身份证号码,可以立刻知道你最近通话记录,近期活动区域,家人信息,银行卡和余额等等,请不要惊讶和震惊,因为这种工作,在目前国内的市场上已经有很多人在做了,而且已经形成了一个隐蔽庞大的市场。例如在群里,随处可见的:

而这只是小规模的个人作坊、游击队。真正在市场上占主导地位的,是那些打着大数据名头的各类貌似正规的公司,这些公司掌握的数据就更惊人了,各种维度无奇不有,比如我就见过一个号称拥有多地房产数据的公司,包括房产持有人姓名、身份证等信息。

由于大数据的兴起,对社会产生了巨大的改变,拥有数据则拥有未来。在这种形势下,拥有数据的公司和机构成了香饽饽,而正规机构涉及个人敏感数据的销售,需要受到各种监管,也不可能直接转售。因此蓬勃的需求形成了巨大的市场空间,也就产生了各类来路不明的所谓大数据公司和商贩。 整体产业运作上见下图:

源头数据产生方:黑客or内鬼

① 黑客数据

与大家想象不同的是,市场上最多的,并非黑客拖库的数据。黑客的数据有几类,一是以账号密码为主,黑客们重点关注是这一类,玩坏了之后丢出来卖掉。具体价格要看库的时间,对象网站的重要程度,下家收购之后用来撞库。

第二是出售WEBSHELL,网站可能本身数据没什么价值,但是可以用来做肉鸡,这种价格也极为便宜,通常几毛到几块,无售后,可能买来之后shell就被清掉了。这类情况基本上都是权重极低的小站,而且从价格上来看,也一定是大规模自动化工具的结果。有价值的shell,是不会这样甩卖的。

第三,黑客类的数据以死数为主,所谓死数,是指一次性的、不再更新的数据。这类数据只能用作参考,无法动态实时,所以价格也不高。除非是一些具有长期效用的数据,例如公安部门某次抓到的嫌疑人,电脑上有接近6亿人的身份证号码,但这种由于在市场上多次转手,价格也不会太高。

第四则是各类电商订单数据,一般是隔夜数据,大概在7-15元每条左右,数据内容包括姓名、手机、商品名称及链接、金额等数据。主要是用来做退款欺诈。是目前单价较高的、产业链较全的行业。

第五是金融账号数据,主要来自于钓鱼,这个产业链就更庞大了(如果钓鱼也算是黑客)。下图是一个可以装在电瓶车上的伪基站,也可以做成背包等各种形式,即使是伪基站,也有多个分工种类。制作伪基站?走街串巷发短信?制作好声音、奔跑兄弟、我是歌手和各大银行网站?加料?洗料?洗钱?取手等多专业。另外还有各类木马、传播渠道等工种分类,就不展开说了。这类数据包括卡号、密码、名字、身份证等四大件,也包括一些第三方金融机构的账号,这类数据价值更高,有实力的欺诈分子会自己直接洗掉,一些小中间商则会转卖出去。

②内鬼数据

第二种则是内鬼数据,内鬼数据相比黑客数据,品类非常丰富,其中部分数据可以隔夜更新,在市场上更多的是这类数据。由于数据过于庞杂,无法分类。我大致说一下我见过的几种。

一是面单数据,所谓面单,就是邮寄快递单。面单根据行业不同,大致分为电商订单类、保健品类、信用卡成单。电商订单好理解,主要用于订单欺诈类。保健品是指壮阳、三高、糖尿病甚至延年益寿,包治百病的治疗仪之类,主要用来欺骗老人、二次销售。信用卡成单,信用卡办卡成功后会邮寄出来,而这个环节上有多个泄露点存在,从印刷工厂开始,到快递公司,物流点都有可能泄露,面单的信息包括姓名、开卡行、手机、地址等数据。这些信息是钓鱼最好的料,这里还有更恶劣的玩法,点到为止不多说。

二是各类考试、学校培训班数据。当你报名考试后,很快就有人来推荐资料,推荐培训,是一种典型的手法。另一种则是根据实际情况进行钓鱼,比如著名的XX通数据,就是在市场上比较受欢迎的一种,给家长发送下载APP的短信,从而进行钓鱼,这类数据50万数据200块钱的样子。还有建筑行业的一建二建,医生,公务员,股民,驾校等各类数据。

三是金融类,银行卡号、余额、姓名、身份证号码、贷款、住址、购买的理财产品及额度等各种类型。这些数据不是内鬼是很难拿出来的,数据的可利用价值就更高了,推销、钓鱼、加料,很多环节都用得到。

四是身份信息类。最基础的身份证号码和姓名表格,这属于烂大街,都不好意思卖那种。稍微丰富点的维度,比如我见过户籍的,从姓名、住址、联系方式到家庭成员关系。收入调查的,工作单位、职级、年收入。再有一类是由于网上开户的兴起,开始出现身份证图片、本人手持身份证图片的数据,用来做各种薅羊毛、贷款业务

数据掮客

上游数据出来之后,会有人专门拿出来叫卖。叫卖的一般有三种情况:

1、诈骗

说起来蛮无聊的这些人,号称自己有某某数据,并且会有一些截图和样例。实际上就是骗钱的,几十块的也会骗,偶尔会骗到大买家。纯粹诈骗的情况不多,但多数情况是真假混合,也就是注水。

2、转卖

自己用完的数据拿出来转手。所以市场上会有一手二手的说法,一手隔夜数据是价格最高的,二手甚至更多手的数据主要是做大数据匹配和营销。

3、注水

目前市场上最常见的情况,例如号称5000万高端银行VIP数据,而实际上中间会混杂了各种数据,甚至有的干脆就用EXCEL公式伪造数据。

具体的数据交易渠道,主要是QQ群,为了躲避腾讯监测,会使用很多暗语来表达,比如:拦截马、大小额通道、面单、料主包养、裸号、菠菜等等之类的暗语黑话,甚至江湖上的切口也出现了。具体的支付通道,主要是支付宝交易,一般是先款后货,所以经常可以看到货不对路的买家在群里破口大骂。但更多是建立稳定中间渠道之后,私下的交易。

数据加工

掮客实际上只是买卖数据,并不做实际意义的数据处理。真正购买数据的大体上:电信欺诈分子、商业推销、大数据公司。电信欺诈和商业推销大家耳熟能详,不做解释。目前有一些所谓大数据公司也在悄悄的加入,通过数据拼接,形成大数据库,然后封装成查询接口向外出售,其中相当部分是有正规合同和发票的。

数据在经过这些大数据公司拼接之后,形成了一个威力更加强大的数据库,能够把一个人关联拼接出一个宽表,而这个宽表可能会涉及当事人多项隐私数据,从收入到房产、社保、亲属关系、照片、银行卡余额、贷款记录、近期活动位置、常用手机设备、家庭详细住址、网购记录、账号密码。然后分开或完整出售单条数据,每条售价可达几百元。这个收入十分惊人,而且每条数据都可重复出售,定期更新出售。

正因为这其中的利益十分巨大,所以市面上已经可以见到一堆的公司在做这件事了。在地下QQ群里,你只要说我是做大数据的,卖主立刻就明白了。

结语

综上,数据交易已经十分猖獗,而对这些行为的打击却罕见案例。很多案件实际上由欺诈引起损失之后破案,而少见针对数据交易的针对性打击,究其原因,还是因为数据交易并未对当事人产生直接经济损失,所以报案、立案动力不足。但是,如果不打击这类行为,其隐性损失也将十分巨大。当大家生活在一个毫无隐私的世界里,那是一件十分可怕的事情。

欢迎加入本站公开兴趣群

软件开发技术群

兴趣范围包括:Java,C/C++,Python,PHP,Ruby,shell等各种语言开发经验交流,各种框架使用,外包项目机会,学习、培训、跳槽等交流

QQ群:26931708

Hadoop源代码研究群

兴趣范围包括:Hadoop源代码解读,改进,优化,分布式系统场景定制,与Hadoop有关的各种开源项目,总之就是玩转Hadoop

QQ群:288410967

;