2015云栖大会•广东峰会广州举行 华大股份CEO尹烨畅谈《你,就是大数据》

2015年12月23日,广东省云计算大数据开发者大会暨2015云栖大会·广东峰会在广州举行,华大股份CEO尹烨受邀出席并作了题为《你,就是大数据》的精彩演讲。

尹烨以每一个人生命的起始、生长、发育的各项大数据切入,阐述了“生命是一个奇遇,每人都是大数据的载体”,并讲述了以庞大的基因数据为基础,用基因科技守护生育健康的巨大可实现性和美好前景。

尹烨从预防出生缺陷、调节优化肠道菌群到精准防控甚至肿瘤防控等生命健康领域的各个方面讲述了基因和健康的关系,并以华大基因董事长汪建为例,通过临床影像、生理生化等常规以及基因水平的全时全景监测和干预,全面地诠释了汪建董事长守护健康的方式。

“健康的本质是人性的管理”,尹烨认为,只有用人性战胜“懒熵”,做好健康最本质的管理,才能在基因科技助力生命健康的坚实基础上,实现人人健康的大愿望!

据了解,本次大会由广东省政府和阿里巴巴集团主办,以“数据引领,飞粤云端”为主题,数千名国内外开发者齐聚广州,展示了智能交通、生命科学、智慧民生、人机交互等领域的创新成果。

附:演讲实录

很多人问我基因大数据是不是个忽悠的东西,做了这么多基因数据,做了这么多健康数据,到底这个行业,基因+、互联网+在一起能产生些什么?所以今天我把这个题目更互联化一点:《你,就是大数据》。

大家看我们都长得差不多,实际上把这些量化数据全部总结起来,你会发现非常不一样。生命本身就是一次奇遇,我们是上亿的精子去竞争一个卵子,这就是大数据。大家不要以为那一亿的精子没什么事。从建国50年的数据来看,50年前,成年男性的精子大概有四千万到九千万个,现在已经降低到两千万个,所以有人提出男性会不会消失,Y染色体被X染色体攻占?但是不要担心,大部分人还会生出一个健康的宝宝。过了13周后,宝宝的心脏、胎心监护已经可以听见了,已经跳动了1100万次;而在14周的时候他开始子宫内排泄,开始有羊水。整个孕期一个女性将近产生一个立方米的羊水,当然大部分被排泄掉了;到了40周,也就是这个孩子快出来的时候,心脏已经跳了5千万次,心脏是在睡觉的时候也在工作的,所以要感谢一下心脏。

中国去年出生了1600多万的新生儿,也就是说每一秒有3个新生儿出生。在一岁的时候,你的体重已经从出生的5到8斤,可能会double,这个过程中你睡了6千个小时,差不多70%的时间你都在睡觉,你会哭500个小时,喝一千瓶奶,这些哪个不是大数据?我们可曾想过我们就是这么一点点长大起来?这些概念大家可能会知道,那再讲一个大家不太注意到的,一辈子一个人会出多少汗?大概相当于两百个人的重量,14吨,有些人多,有些人少,这不是大数据吗?汗液是可以通过它的离子源判断很多背后的生理生化指标。一个人一辈子心脏泵出的血量是多少?即使是工业8.0也做不出一台像心脏这样精密的机械,每一天给你泵出8千克的血,一辈子加起来相当于把18个足球场全部铺满,这些哪些不说明你的心电、猝死等跟这个有关系?人有多少个细胞?这个细胞的总数非常巨大,大概有100万亿的细胞,相当于1600米长的沙滩。我们有多少基因,有多少DNA,我们大概有30亿对碱基,而这些碱基写成书的话大概564本,如果要阅读每个人,大概花10年的时间。

华大与阿里合作无非想把这些数据进行数据化,通过各种各样的算法,使之能够更好为我们的生产、生活服务。基因这个词是1911年才诞生的,翻译得非常好,英文叫gene,中文叫基因,基本的因素,就是由ATCG组成,你把它想成一副牌也可以,黑红梅方。每个人没有太大的差距,你看这些物种会觉得虽然我们比他们更高等,但是我们的骨子里是同“并”相联的。大家看这是一株草,我们的基因有多少跟他们是一样的?17%。下来是一只苍蝇,为什么在华大不能打苍蝇?39%的基因跟我们是一样的,这叫“欺师灭祖”;我们跟热带鱼有63%的基因是一样的,所以大家要好好养鱼;我们和老鼠有80%的基因是一样的;到了广州动物园看到了猴子,我们跟它share了93%的基因;而我们跟猩猩差不多96%的基因一样;而我们人与人之间的差别,只有千分之五,但是这千分之五的差别如果发生在一些特殊的基因上,就会产生不一样的效果。

比如你可以像姚明长到2.26米,或者像这个钱德拉只有0.6米,但是他们俩都很健康,也符合我们健康人的标准,几个基因不一样就造成了这样的结果。基因并没有那么神秘,它决定了我们非常多的性状,我随便讲一些大家可以马上验证的,你的拇指能不能弯,你的舌头能不能卷,你的眼皮是单是双,你能不能喝牛奶,你酒精代谢能力好不好,能喝酒还是不能喝酒?中国人容易得肝癌,但是不怎么得黑色素瘤。美国人基本不得肝癌,但是较常见黑色素瘤,那能不能出一个基因武器?这是完全有可能的,基因决定了我们非常多的表型的性状。可能在未来某一天,我们再推出一个社交工具的时候,也许会基于基因社交,我们在找自己另一半的时候可能会看一看你是什么基因,我是什么基因,你的基因弱爆了,我的基因很牛,这是有可能的。

那么大家看一看,这是一对异卵双胞胎,一个妈妈生的,肤色不一样,算概率是几百万分之一,但是生命科学唯一不例外的就是例外。爱因斯坦说上帝有时候会扔色子,这就是扔色子生出来的,还好我们有一个技术叫亲子鉴定,这就是一对双胞胎,他们很健康很幸福。当然,在中国还有一个我每次提起都很揪心的数据,去年有1600万的新生儿出生,5.6%的出生缺陷,这些人在社会医疗和福利救治的情况下非常凄惨的生活着,得不到救治甚至遭受严重的歧视。如果基因大数据能满足一个愿望,我希望让基因技术守护基因健康,让孩子不输在娘胎里,让每一个孩子通过基因检测的方式变得更好。

大家很担心肿瘤,特别是现在一去北京出差,很多人就说今天又雾霾,这个东西会不会让我的呼吸道受损?负面影响肯定是有,但是我们现在还没有办法从数据角度准确地确认。肿瘤的发生是细胞的生长失控,换言之就是基因失控。通过放疗、化疗治疗肿瘤已有几十年时间,也许部分有效,但是绝大部分来讲,副作用很大,经常伤敌一千,自伤八百。未来,基因可以实现肿瘤的靶向治疗,一把钥匙开一把锁,要求它精准、个性化。

大的医学更需要我们的政治家、政府去保驾护航。或许我以前对肿瘤还很悲观,直到两个月前看到这个案例,我开始慢慢相信,只有暂时无法治愈的肿瘤。这个小孩叫蕾拉,一个英国的孩子,三个月的时候诊得了有急性的白血病,化疗、骨髓移植都无效,5个月大的时候这个孩子被认为无药可治了,但是我们的基因科学家、细胞科学家开发出了一个超级药物,通过基因编辑和免疫治疗,同时改成了跟这个孩子一样的骨髓配型,在体内不排斥,这是一个超级精确的治疗导弹,是基于大数据的结果,也是基于现代基因技术的结果,这一切为我们的血液肿瘤乃至所有实体肿瘤的防治带来了无限的希望。有人说为什么我有时候不吃药想一想也会好,因为冥想会改变基因的表达。有人说为什么我会有第六感?因为我们磁感蛋白刚被解密,今天的生物科技正在史无前例地往前走,人类为什么有磁电感应?这些磁感蛋白可能就是我们所谓的第六感的由来。

那么,精准医疗对生物大数据还不能简简单单就是一个基因技术,应该是包括基因数据在内的全组学的技术,有基因的作用,蛋白的作用,小分子的作用,有社会心理的作用甚至还有其他可以来帮忙的东西。比如一个正常人,你从来不是孤孤单单一个人,每一个人都是一个生态,一个一百斤的人体内会有四斤的细菌,这四斤的细菌的组成超过了一千种,分布也不一样,它的细胞总数是人体的100倍,这些细胞能干什么?

这是一对双胞胎,他们两个菌群不一样,他们俩的体重也不一样;这是两只老鼠,在对调菌群几个月后瘦的变胖,胖的变瘦,也就是说你吃进去的食物无非是你肚子里细菌的培养基。我们可以通过一点点粪便去查它的菌群,给一个精确的大数据分型,这个分型的辨识度已经超过了血型,我们对它的理解有干吃不胖、喝凉水长胖,结直肠癌、抑郁症、三高都跟它有关系。而且假如我在广州长大,从小吃海鲜,后来因为工作把我调到了西北,你很高兴,职场发展了,但是菌群不干了,小的时候你用海鲜喂我,到了西北之后我每天吃兰州拉面,这些菌群就会生长不好,就会释放细胞内毒素,内毒素入血,作用到大脑,告诉你我要吃海鲜。

这是这两年《Nature》、《Science》发表的,菌群可能即将以一种智能生物的方式成为我们体内一个更大的器官,和人体产生互动,毕竟微生物才是地球之王。人类诞生无外乎几百年,菌群已经诞生了30多亿年,谁是这个地球的老大?今天很高兴阿里创造了一个非常好的平台,这么多人都去创业,大家都通过某一种可穿戴设备,汇总生物大数据,开始是被动后来是主动的,然后是自动的,再然后变成了深度的人工智能,这些都会写到人一生的生命大数据。

今天常规的中国人活74岁,一个人除去影像学数据65M而已,但是如果把我刚才说的事全部做完,一个人多少?4个T,量子计算加DNA存储这是我们感觉可以做得到的,量子计算我没有发言权,但是DNA存储是很牛的。人工的东西是不可能比目前自然规律产生的东西更具高效性。而DNA存储无非是把01转化为ATCG,从密码学、合成生物学来看这些都是可能实现的,这是一个很有意思的未来。

华大基因的董事长汪建,这位老人家基本上记录了他所有的信息,我们逮到他第一件事就是抽血、验尿,我的细胞我知道,我的生命我做主,我的肠道我掌控。他的酸奶是根据他肠道里的菌群特调的,他的运动量、吃的食物都是我们做成一个专属的APP指导。影像学把他的血管斑块、造影看得清清楚楚,基因测序让他对所有的肿瘤严防死守,激素、维生素、氨基酸、代谢、生理、生化、功能睡眠、营养、情绪都有影响,衰老根本是一个心理的概念,不要说我老了,心理的概念,人生七十古来稀。今天中国平均年龄74岁,70岁到底是老还是不老?我特别反对一个词,“养老产业”。我们要保住自己的“体值”和“颜值”,中国人就是两个死法,要不然心脑血管死,要不然肿瘤死,如果这两个保住了,这个人可以向哺乳动物生命极限去活到120岁到140岁,所以老汪自己给自己做了一个碑。我觉得几千年来好像就这么一个人敢把自己哪一年去世也雕出来,1954到2074。老汪说要吃得健康,活得长,死得痛快一点,你要让你的健康年龄和生理年龄无限接近,而不是把最后几年时间放到大医院。但是大家不接受,后来我们文艺一点,叫“活得好又长,走得快而安”,我觉得这才不枉人生在世走一番。

吹了这么久,大家说基因万能吗?基因能干的事很多,但它不能解决全部的问题,比如中国现在第一大的、可能的慢性病隐患就是颈椎病,我每当讲到这个的时候看到在座的都有点眼晕,这东西从微信到微博,每6.5秒就低一下头,这是一种传染病,它的感染源是什么?微博、微信,没准还有阿里巴巴,大家淘宝购物,传播途径是3G、4G、WIFI,易感人群是所有的网民,易感人群越来越多,有人说有疫苗吗?我说那大概是停电吧,没有办法,这个事跟基因有关系吗?真的没关系,没有任何一种传染病是可以不分男女老少都得的,只有通过互联网,一个硅基的程序感染一个碳基的生命,传播得太快。

所以有人问我人工智能真正来的时候究竟会怎么样?我想第一个回合,我们碳基的生命创造了一个硅基的程序,就能把碳基的生命全部干掉了,这是很难的。对人工智能来讲,大家双向去看。但是怎么才能治颈椎病?除非大家一起改习惯,或者你有意识的不断的去保护自己。因此,健康的本质是人性的管理。30年前糖尿病只有大概1%,现在我们有12%,50岁以上的人一般三高,为什么?基因都没变,吃得太多,动得太少,当你发现峨眉山的猴子都开始得糖尿病的时候,你就知道瘦猴这个词在人类的历史上不存在了,它可以很轻松的从游客的那瓶饮料中获得从野外不能获得的糖。

人性管理也很重要,这些东西归根到底,我们的生命、我们的健康绝不是交给医生、医院,而是实实在在的掌握在每一个人的手中。如果说让我许一个人人健康的大愿,我希望是用我们的人性去战胜每一个人天生的懒熵,科技再发展,云计算再快,基因再精准,如果人性做不到还是不行,不忘初心,方得始终,谢谢。

;