捉“毒”,大数据显威力!

捉“毒”,大数据显威力!

真实世界永远比我们想象得更出人意料。

研究显示,零号新型冠状病毒肺炎患者其实与华南市场并无直接关联。那么,他通过何种渠道感染病毒目前无从得知。零号患者体内的病毒是否直接来源于野生动物或者野生动物的排泄物,还是另一个隐身于茫茫人海中的病毒感染者?

目前,不得而知。

确定病原体的重要性

既然已经知道了病毒,为何科学家还执着地寻找源头?面对《中国科学报》的采访,香港大学公共卫生学院教授朱华晨表示,确定来源才可以从源头和根本上切断传播链,避免病原的再次引入和再次暴发。

而确定病原体的来源需要做一系列的系统工作。首先是根据流行病学关联,找到患者可能接触、暴露的现场,采集各类与病原体可能有关的标本,看是否能检到类似病原体。

如果找到阳性病原体后,需要继续向上追溯其来源,包括产地、运输过程可能接触、暴露的地方。然后把所有病原体全部测序,根据序列的纵向进化和横向亲缘关系来推断病原体在不同宿主中传播的来龙去脉。

新冠病毒早已经被证实了人传人,是否可能存在人传动物,朱华晨认为,也有可能,但无证据。但目前传染源都还没搞清,这些就更不可能清楚了。但如果真的可以人传动物,单纯隔离人类的措施对疫情是否完全可控,朱华晨表示,仍有待商榷。

基于基因组大数据的防控策略

虽然寻找新型冠状病毒病原体的工作仍在继续,但借助二代测序技术对该病毒本身的研究难度并不大。

通俗地来说,对于一个疑似患者的样本,例如肺部灌洗液,目前的技术可以把各种可能的致病微生物的基因组DNA序列都读出来,编成目录,临床医生和技术人员可以直接阅读这些“最底层”的信息,对比未发传染病患者的样本信息,快速发现可感染人类的新病毒。

据了解,单个冠状病毒基因组大概在26kb~32 kb(1kb=1024字符)。这种长度对于目前测序技术而言,没有特别困难之处,检测成本也在可控范围之内。

然而,关键在于标本的安全性以及对样本间交叉污染的控制。而要排除污染,需要建立符合质量控制和生产规模的高通量检测实验室,这需要花费相当的时间。

此外,采访中,专家还表示,随着疑似患者样本源源不断送出来,检测机构要能在有效时间内抽提DNA并完成测序,然后与已知的新冠病毒基因组数据进行比对,以确定患者体内是否感染新冠病毒。

不过,通过测序来进行诊断,成本和技术要求都较高。目前,主要通过聚合酶链式反应(PCR)检测来对新冠病毒进行诊断。

但科学家们却可以从病毒基因组大样本数据中,寻找出传染能力最强的毒株,进而快速理解传染力的形成,并对之产生相应的最有效的防控策略。

而目前困局是,这样大样本病毒基因组数据库是否存在,没有答案。

以数据追踪“可疑人群”

当前,全国多数城市都采取了严格的手段以遏制新型冠状病毒的蔓延,这就可能通过用户数据进行采集。

对此,上海大数据联盟常务副秘书长马慧民告诉《中国科学报》,“非常时期用非常手段,只要确保采集到的个人位置数据仅用于疫情防控就可以。目前除了三大运营商以外,微信、支付宝等都有用户的基于位置服务的数据(LBS数据),通过整合感染人群的各种LBS数据,就可以还原病毒的传播轨迹了。但是这些LBS数据的采集获取和分析处理需要额外经费投入,根据感染人群规模扩大而增加,建议由政府财政支出。”

“移动互联网时代,大数据对于精准疫情防控将会起到重要作用。每个人在哪个位置,去了哪,跟什么人有接触,都可以通过手机位置记录下来。”马慧民提议,此时,关键在于有效锁定疫区人群,及时掌握疫区人群的流动以及人群到其他城市之后具体的分布。

那么数据从哪里来?马慧民认为,一是可以由面及点的做法,即把去年12月以来华南海鲜市场里的手机信令数据和各类交易信息都调出来,结合大数据平台追踪这些人群的流向,就可以还原重点人群分布和流动图,形成对于疫情发展的总体判断。二是可以由点及面的做法,即采用小程序把已确诊病例、疑似人群都管控起来,要求这类人群在小程序及时登记填写信息,通过大数据平台将这些人群自登记之日前14天的活动轨迹还原出来,寻找到其中的密集场所,并形成高危场所数据库统一对公众发布,以便于公众自我检查。”

之后,再结合在医疗机构中获得的病毒基因组数据,就可以重点追查强传染性的潜在患者。

数据建立新信任机制战疫情

此外,马慧民认为,还可以尝试用区块链来记录每个病例。等于是给患者和每个疑似病例建一条链,那么所有在他这几周出现的位置上的这些信息,与他(接触)的人群都可以在链上。区块链不可篡改,而且可以溯源。”

其实,区块链不仅仅可以应用在防疫方面,还能在更大范围内起作用。

“比如,关于各类医用物质的使用去向、疫情早期到底被谁耽误了等。”马慧民表示,新的一种数据的技术,可以让我们每个人从中获得新的信任感。

这样一来,信任机制的建立不是靠人或机构的承诺,而是新的数据平台。

“真实世界永远比我们想象的更出人意料,因此人类面对自然必须要有谦卑的心态。”马慧民说,从预防、溯源、治疗、随访、追踪、管理、物流、信息发布和问题解答等方面构建大数据平台,将湍流不息的数据和嗡嗡作响的机器转化为对每个人的关怀,最后尽早地打赢这场战“疫”。

版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。

;