Pacbio单分子实时测序技术于药用植物基因组研究应用
药源短缺成为限制临床治疗和新药研发的最大瓶颈,因此,开发新的药物来源途径是迫切需要解决的问题。利用现代生物技术和次生代谢工程手段是未来生产药物最有潜力的发展方向。我国药用植物有1 万多种,大多数药用植物遗传背景不清楚,基因组信息缺乏,遗传信息和功能基因的研究亦极为薄弱。例如人参属(Panax) 和红豆杉属(Taxus) 分别作为最重要的人参皂苷和紫杉醇天然来源植物,功能基因的研究亦相当有限。阐明和完善重要药用植物次生代谢产物合成途径及其调控研究,是一项紧迫的任务。
DNA基因测序技术从上世纪70年代起,历经三代技术后,目前已发展成为一项相对成熟的生物产业。测序技术的应用也扩展到了生物、医学、制药、健康、农林、园艺、花卉、环保、法医等许多领域,并成为一项与我们衣食住行密切相关的高技术产业。据最新统计,2012年全球基因测序市场的产值已超过百亿,按最近几年增长速度,预计2017年市场产值将加倍。因此可以说,基因测序在我国生物科技领域具有非常重要的战略意义。
“第三代测序技术”的研发已有近十年时间,商业化的第三代测序仪上市也有三年,目前,国内科研单位老师也逐步选择Pacbio单分子测序技术应用于药用植物基因组研究应用:
一, 中科院药植所揭示丹参叶绿体DNA修饰之间复杂的相互作用
2014年6月10日,中科院药用植物研究所(IMPLAD)刘昶团队在《PLOS ONE》杂志上发表了利用PacBio测序技术揭示丹参(Salvia miltiorrhiza)叶绿体DNA修饰之间复杂相互作用的相关文章,该文章报道了丹参叶绿体中编码及非编码RNA的表达情况。这也是国内PacBio第三代测序用户在国际性杂志发表的第一篇文章。丹参是最广泛使用的药用植物之一。作为基于叶绿体基因工程手段开发使丹参活性成分过表达方法的第一步,该研究团队从基因组,转录组,和碱基修饰三方面对丹参叶绿体进行了分析。先从新鲜叶片中提取总基因组DNA和RNA,然后进行链特异性RNA测序和PacBio公司的单分子实时(Single-Molecule Real-Time, SMRT)测序分析。实验先是将RNA测序得到的reads mapping到基因组,使该研究小组确定了80个蛋白质编码基因的相对表达水平。此外,还明确了19个多顺反子转录单元和136个假定反义和基因间非编码RNA(ncRNA)基因。将蛋白编码基因的转录本(cRNA)丰度与重叠反义非编码RNA(asRNA)相比较表明,asRNA的存在与cRNA的丰度增加有关(P<0.05)。使用SMRT Portal软件预测到了2687个潜在的DNA修饰位点和2个潜在的DNA修饰基序。两个基序包括TATA盒样基序(CPGDMM1, \&\#39\;\&\#39\;TATANNNATNA\&\#39\;\&\#39\;),以及一个未知的基序(CPGDMM2, \&\#39\;\&\#39\;WNYANTGAW\&\#39\;\&\#39\;)。
研究采用二代和三代DNA测序技术并用,使在基因组层面研究非编码RNA和DNA修饰成为可能。然而,原来关于反义RNA和DNA修饰研究在实验上具有相当大的困难。首先,大多数asRNA转录本表达水平显著偏低,因而难以用经典技术如Northern Blot和原位杂交进行验证。第二,正义和反义转录本之间错综复杂的关系意味着实验扰动会不可避免地干扰其他转录本的表达。因此,通过knocking-in和knocking-out技术确定转录本的生物学功能是复杂的。第三,虽然SMRT技术已被证明能够检测到潜在的DNA修饰,但验证这些修饰仍然是个挑战性的任务。第四,叶绿体asRNA和DNA修饰的存在和功能的验证是更加困难的。
综上所述,本研究所描述的一些发现从目前的技术上来讲是有巨大进步的。然而,本研究提出的数据已经证实了由asRNA和DNA修饰引起的基因表达调控的复杂性。
二, 中国林业科学研究院完成首个木本药用植物全基因组精细图
中国社会科学院11月26日举行《杜仲全基因组精细图》绘制完成重大成果新闻发布会。这是世界上第一个橡胶植物全基因组精细图,也是第一个木本药用植物全基因组精细图。
2012年7月,中国林业科学研究院经济林研究开发中心率先启动了杜仲全基因组测序和精细图绘制项目。这是目前为止第一个完成全基因组测序的木本药用植物,也是唯一的硬性橡胶植物全基因组。由于杜仲的栽培历史悠久,杂合度高,基因组大,重复序列比例高,为极其复杂的植物基因组。经过中国林业科学研究院经济林研究开发中心等研究人员共同努力,克服了组装拼接技术难题,并在杜仲全基因组测序和精细图绘制方面取得了突破性研究成果。
本研究首次在木本植物全基因组测序中科学地结合第二代和第三代测序技术,采用混合组装方法,攻克了杜仲基因组的高杂合、高重复序列带来的组装困难等瓶颈问题;获得了大量杜仲橡胶合成相关的功能基因,将加快高产胶杜仲新品种培育,有效降低杜仲橡胶产业化成本,促进杜仲产业健康快速发展;挖掘了大量杜仲药用成分相关的功能基因,为筛选和培育杜仲高药用成分新品种提供了坚实基础;发现了大量杜仲抗逆性和环境适应性相关的功能基因包括耐热基因、抗寒基因、抗旱基因、抗盐碱基因、抗虫基因等,揭示了杜仲适应性强的分子机制。
杜仲是名贵药材,同时也是我国特有的世界唯一的硬橡胶树种。其具有很高的药用价值和保健功能。该成果对破解杜仲遗传密码、杜仲橡胶形成与高效合成机理,加快杜仲高产胶、高活性成份、高抗新品种培育进程,促进杜仲产业化发展具有重大意义。
药用植物功能基因的研究,主要是为了发现药用植物天然活性成分合成功能基因及其表达规律,确定有效药用活性成分的生物合成途径,了解其调控机制,同时研究其基因组多样性,并将所得的序列信息用于品种鉴定、资源保护和扩大、种质繁育等多个方面。针对具有重要经济价值的药用植物和代表不同次生代谢途径的模式药用植物开展基因组系列研究,例如转录组序列测定、组装和生物信息学分析,对于目前药用植物功能基因研究还很不完善,大多数药用植物缺乏基因组信息的现状具有很大的现实意义。功能基因组学改变了经典的单个基因、蛋白、代谢产物的纵向的研究方式,取而代之的是全面、整体的基因、蛋白质、代谢产物的横向研究方式。通过分析大多数(如果不是全部)参与特定生物学过程的分子,功基因组学尤其是转录组学研究,提供了生命活动的整体、全面的描述。
新一代单分子实时测序技术是对传统测序方法的一次巨大的变革。PacBio RS测序仪系统全面解决了二代测序几大困扰:海量数据拼接难,变异检测假阳性高,稀有突变被淹没,高GC含量区域无法跨越,高度片段无法准确测定等,得到高质量,完整的数据信息,为合作伙伴提供优质的基因组组装,目标区域测序,碱基修饰检测等技术服务。天津生物芯片在三代测序领域积累了丰富的经验,针对不同物种基因组的各种杂合度、序列重复性等特点,将采用第二代测序技术和第三代测序技术结合的方法,可以帮助合作伙伴获得相关的功能基因,能够对理解物种的生物学和生物化学的各个方面提供新的信息,将有力地促进药用植物资源更好地发展和利用。因此,单分子实时测序在药用植物基础理论和生产实践中均具有重要的意义。它提供了一种快速、高通量、全面解读药用植物基因组信息的全新技术手段。为功能基因挖掘、药用植物活性成分的生物合成与调控、药用植物种质资源评估与扩大、探索药材道地性分子机制提供了新的思路和方法。通过生物合成途径和基因调控的研究,推动药用植物次生代谢工程的发展,提高中药材的品质,为中药的良种选育、规范化种植和质量控制提供技术支撑。