2015国际基因组学大会(中国•西安)分会一:基因组学与大数据
导读
2015年10月23日-25日,由中科院北京基因组所、西安交大和中国遗传学会主办,紫鑫药业、路思达生物、今唐健康共同承办的“2015国际基因组学大会”于西安顺利召开!25日,大会围绕“基因组学与大数据”、“表观基因组学与转录调控”、“法医基因组学”、“海洋微生物基因组学”四大主题举办了分会报告与讨论,各位专家学者的专业报告获得与会人员的阵阵掌声。今天我们先来分享一下“基因组学与大数据”分会的精彩瞬间。
组学发展和大数据的讨论成为近年来各行业最热的话题之一。随着生物学与医学的发展,海量数据迅速形成。例如DNA测序性能显著提高,成本大幅降低,基于基因组学、后基因组学(功能基因组学)的现代生物技术取得了飞速发展,加之大量临床数据的积累,生物科技行业的大数据时代迅速迫进。身处组学与大数据时代,让我们仔细聆听各位专家学者怎么看!
作为本次大会的支持人,于军研究员做了题为《Lineage-associated Variations of Core Genomes Restrict Horizontal Gene Transfer and Species of Eubacterial Taxa》的专题报告,从生物学家的角度为大家详细讲解了细菌进化的分子机制。
Cancer Precision Medicine: A Cancer Haiimark Network Framework for Constructing Predictive Models Using Genome Sequencing Data
加拿大国家科学院资深研究员,麦吉尔大学生物信息学中心教授
在过去的数年间,人们往往习惯于采用线性生物学通路来描述和研究生物过程、表型与疾病的分子机制。但是,随着生命科学技术的不断发展,越来越多的研究表明在不同的通路之间存在着许多的交叉,并且彼此形成复杂的分子网络来调控生命体的生物过程、表型以及疾病的发生。
毫无疑问,现如今分子网络建模已经成为设计试验性假设、鉴别生物过程和疾病发生中关键基因基因建立转化医学预测模型的有力工具。同时,随着基因组测序成本的逐渐下降,使得分子网络建模的常规临床应用成为可能。但是,针对这些海量的基因组测序数据,迄今为止还没有人开发出构建出预测模型的计算方法,这也是基因组测序技术在临床应用中的重要瓶颈。
报告中,王教授阐述了一种新方法——Cancer Hallmark Network Framwork(CHNF),采用肿瘤基因组测序数据构建预测模型来实现个体化医疗,并且讨论了如何利用源自CHNF中的计算工具进行个性化治疗、患者生存率检测、肿瘤复发预测,以及个性化癌症风险检测。
Bioso !—A Search Engine & Annotation Framework for Biological Big Data
中国医学科学院基础医学研究所研究员
随着测序数据的不断增加,不同生物学数据库的整合已经显得越来越重要,不仅仅包括复杂查询和检索的重要数据库,还包括那些进行组学数据注释的知识库资源。
朱伟民研究员为我们介绍了多面的科研成果——Bioso,它就是用来处理生物大数据时代上述亟需解决问题的重要工具。作为一个搜索引擎,它可以在20个以上的数据库之间轻松查询获取所需信息,内容丰富,界面设计灵活,是一款非常便捷的组学数据注释及分析工具。
Genetic diversity and evolutionary dynamics of Ebola virus in Sierra Leone
军事医学科学院微生物流行病研究所教授,病原微生物生物安全国家重点实验室分子生物学、生物信息学研究室主任
2014年3月首次鉴定出的埃博拉病毒在西非感染了25,000名患者,其中死亡人数达到10,000人。根据2014年3月到 6月间采集到的81株埃博拉病毒基因组序列的初步分析,表明2014年发生的埃博拉病毒感染事件是一次人人传播的独立传播事件。
称埃博拉病毒基因组突变会影响基于测序的病毒检测和疑似病例治疗。但是,2014年7月埃博拉病毒大肆爆发时,全世界对于埃博拉病毒的了解非常少,有效信息更是有限。在这种情况下,童贻刚教授临危受命,带领团队前往南非进行埃博拉病毒的防治研究工作。通过艰难的摸索取样与无数次试验,终于取得了胜利,并采集了许多珍贵的病毒样本,为推动国际间疫苗开发与疾病治疗做出了巨大贡献。
Genomic and genetic basis of seed nutritional content in Eragrostistef
中国科学院昆明植物研究所研究员,Jeffrey Bennetzen中国研究组负责人
Tef,四倍体草类,是埃塞俄比亚农业的支柱,其种植面积远远多于其它作物。Tef 谷粒中矿物质含量仅仅低于同类作物中的龙爪稷,对干旱和洪涝均具有极强的忍耐力。但是,由于其种子体积小、生存环境恶劣,产量非常低。
王学文研究员介绍,他们已经采用突变和其它遗传学方法来解决这些问题。Tef 蛋白含量和铁含量非常高,钙含量也远高于母乳中钙含量。王学文研究员采用自主研发的GBS方法,根据SNP绘制出了Tef 的第一张高密度遗传图谱。之后,结合SSR图谱,完成了Tef 基因组图谱绘制。并且,根据Tef 基因组图谱进行了矿物质含量相关基因的QTL鉴定,并且取得了一些成果,对于同类作物育种改良具有重要意义。
章张
Community Integration of Big Data
中国科学院北京基因组研究所研究员,“百人计划”获得者
组学数据集成在解决许多重要且复杂的生物学问题的过程中发挥着不可或缺的重要作用。然而,在现如今的大数据时代,数据整合由于其枯燥、耗时、以及昂贵的成本等特点,已然变成了充分挖掘生物大数据价值的重大障碍。
章张研究员在报告中为我们介绍了他多年的研究成果及心得,通过见模块建立了整合组学数据的可扩展、可持续的网络构架。不同类型集成模块的维护由不同领域的委托方负责维护,包括数据的收集、处理、可视化操作,以及通过网络服务传递给需求方。
基于这些集成模块建立了IC4R(Information Commons for Rice),它是从许多不同集成模块中整合各种各样的水稻组学数据而搭建的水稻知识库。据章张研究员介绍,目前该数据库所整合的信息包括:源于RNA测序数据的基因组表达谱、来自成千上万个水稻品种重测序数据的基因组变异、植物同源基因、转录后调控、水稻相关文献、集群注释等。IC4R未来的发展方向是能够整合其它的组学数据,并将这些海量的组学数据与水稻重要农艺性状结合起来。这样,即可达到不同类型组学数据的量化、可持续化的协作整合,极大降低数据库的更新及维护成本,将IC4R打造成一个包含所有水稻数据的综合性知识库,推进水稻相关领域的基础研究和转化研究。
更多精彩,敬请期待!
欢迎关注中科紫鑫人事招聘相关信息:http://www.ngscn.com/index.php/Job/employ