甜蜜蜜!糖科学研究之路

生命体都是甜的,尤其在研究糖科学的人看来更是如此。人体内含有 1000 万至 1 亿种不同的糖蛋白。

碳水化合物(Carbohydrates )是一种非常难以研究的分子,不过从事糖科学研究的科研人员们没有放弃,他们正在开发新型的研究手段和工具,并且积极地向其他人推广他们的新成果,希望更多的人能够更早、更快地用上这些新进展。

摄入过多的糖会让我们的腰围增大,并且带来很多健康问题,但是从事糖生物学(glycobiology )研究的科研人员却面临另外一个难题,那就是得不到足够多的糖。幸运的事,糖这种物质无处不在。哺乳动物细胞外就是一层 10~100 nm 厚的糖衣。我们一直认为这层糖衣就是起到保护的作用,但是美国斯坦福大学(Stanford University )的化学及生物学家 Carolyn Bertozzi 却认为,这片由分枝状糖链组成的“森林”其实还隐藏了很多有用的信息。森林里的“窃窃私语”让 Bertozzi 和其他的糖科学家都着迷不已。

NIH 国家医学研究所生物化学及生物相关化学部门(National Institute of General Medical Sciences (NIGMS) biochemistry and bio- related chemistry branch )的负责人、生化学家 Pamela Marino 认为,细胞的糖衣就好像位于细胞外部的一片生机勃勃的海洋。很多重要的生物学事件,比如细胞之间的相互识别和信号传递等,都发生在这片海洋里。糖除了在机体能量代谢过程中起到了非常重要的作用,还在细胞外扮演了十分重要的角色,比如 O -GlcNAc 对于基因表达就有非常重要的意义。糖还与发育、感染、炎症、肿瘤,以及神经退行性疾病等诸多方面都有非常密切的关联。

美国国家医学研究所生物医学技术部门的负责人 Douglas Sheeley 认为,关于聚糖(glycans)分子在结构上的多样性,以及糖基化(glycosylation,即糖分子与蛋白质、脂质等分子结合的作用)的作用,我们已经掌握了大量的资料了。很多细胞蛋白质在其表达、包装等过程中都是需要经过糖基化修饰的,很多酶都会参与这个修饰过程。糖基化修饰作用就决定了蛋白质的功能,这也是很多科研人员非常关注的一个研究方向。

糖分子研究手段已经相对成熟了,不过还远没有达到基因组学或蛋白质组学已经达到的那个高度。Sheeley 表示,这主要是因为碳水化合物太难研究了。在聚糖分子中,每一个单糖分子(mono-saccharides)都紧紧地与其它单糖分子结合在一起。而且这种结合方式多种多样,在每一个碳原子或糖环结构上都可以发生不同的结合反应。另外糖分子是分枝状的,而不像核酸是链状的,这些都是糖分子研究与 DNA 或 RNA 研究之间不同的难点所在。

从事糖分子生物学研究的实验室通常都会使用下面几种实验手段,包括生物化学实验手段、芯片技术和质谱技术等。但是其他非糖分子专业的实验室则往往会因为担心学习这些技术的周期太长而退缩。Bertozzi 和来自谷歌旗下的 Verily 生物科技公司的 KrishnanPalaniappan 都认为,不论是专业人士,还是非专业人士,都需要这些技术。只有这样,我们才能获取完整的人体糖蛋白组(human glycoproteome )资料,并了解哪些蛋白,在什么条件下,在哪些位点上发生了糖基化修饰。糖分子研究人员们也非常迫切地要求技术的进步和普及,而且他们需要的是能够直接使用的技术。

哺乳动物细胞表面都覆盖着这样一片糖分子构成的森林,这些糖分子存在各种各样的结构和功能,等待着我们去发现。

艰难但有意义的工作

糖分子研究人员们之所以那么积极地研究碳水化合物,是因为这些糖分子扮演了多种非常重要的生物医学角色。据 Marino 介绍,人体的粘膜(比如肺上皮组织)含有一层链状的粘液素分子(mucin ),这些分子上也都结合了糖分子,比如 α2, 6 结合唾液酸( α2, 6-linked sialic acid ),在鸟类中则是 α2, 3 结合唾液酸。如果禽流感病毒的结合特异性发生了改变,那么也能够结合 α2,6 结合唾液酸,然后就可以感染人类了。

病毒能够与细胞表面的糖分子结合,有些病毒甚至能够与多个糖分子侧链结合,以便更加牢固地结合在细胞上。有一些细菌(包括人体致病菌)和细菌毒素一样,也能与糖分子结合。包括 HIV 病毒在内的很多病毒,也会利用糖分子,将其包裹在最外层,以躲避机体免疫系统的识别和攻击。

如今,实验室里已经可以根据自身需要合成出相应的基因和蛋白质了,也可以对自己感兴趣的基因和蛋白质进行测序、改造,还可以利用各种模型系统对这些分子进行研究,并且已经构建了海量的数据库。但据 Marino 介绍,糖分子研究还远远没有达到这个高度,不过他们一直在努力。

NIH 和美国国家科学基金会(National Science Foundation )资助的多个项目都涉及了糖分子研究的内容;美国国家标准及技术研究院(National Institute of Standards and Technology )也下设了碳水化合物部门;美国国防高等研究计划署(Defense Advanced Research Projects Agency )也正在准备开展一项糖科学研究项目;而由 Sheeley 和 Marino 共同领导的 NIH 日常基金也资助了大量的糖科学研究项目。在加拿大、欧洲、澳大利亚和日本,也都在开展各种糖科学研究工作。

一大批类似美国国家科学院国家研究委员会(National Research Council of the National Academies of Science)与世界各地的科研人员合作开展的路线图式研究工作,催生了新兴技术的发展,其中就包括了碳水化合物合成和测序技术。据 Marino 介绍,这些技术目前都已经具备了自动化的潜力。各个实验室都有他们各自的研究视角,有的实验室可能喜欢将糖蛋白降解成更小的片段,使其去糖基化修饰,通过质谱技术来开展研究,看看哪些聚糖会分离出来;也有一些实验室会通过去糖基化修饰的肽段来研究整个蛋白质;当然,还有一些实验室会从整体入手,研究整个完整的糖蛋白大分子。

多聚糖芯片(Glycan array)是一种高通量的研究手段,它有助于发现从蛋白质到微生物等多个层面上的聚糖结合方式。据 Marino 介绍,芯片技术一直都是一个非常强大的研究手段,而且也还在不断的发展和改进之中。比如,美国加州大学圣地亚哥分校(University of California at San Diego)的一个课题组就正在开发一个大规模的唾液酸芯片;而美国埃默里大学(Emory University )的科研人员们则正在开发可以用寡聚核苷酸对多糖分子进行标记的多糖芯片。有了这种芯片,科研人员就可以利用基因组测序技术来了解糖与蛋白质的结合问题了。当然,所有这些正在开发中的新技术也并不是只为了从事糖分子研究的科研人员准备的,这些技术是为所有人准备的。

Bertozzi 等人的团队正在研究如何更方便地追踪 O -GlcNAc 糖基化修饰作用。因为如果使用古老的免疫沉淀和 western blot 方法,则会消耗大量的时间和劳力。同时,Bertozzi 等人也在开发糖蛋白质谱研究技术和标记技术。她们希望这些新技术有助于肿瘤分类和病理信号通路的研究工作,从而帮助解决这些工作中的糖蛋白鉴定问题。美国东弗吉尼亚医学院(Eastern Virginia Medical School)的科研人员就使用了 Bertozzi 实验室的技术——一项结合了质谱和糖类似物分子的技术。科研人员们锁定了前列腺癌肿瘤细胞表面的唾液糖蛋白(sialoglycoproteins),想看看在具备转移能力的肿瘤细胞和不具备转移能力的肿瘤细胞表面的这些蛋白有何差异,结果他们找到了 30 多个在可转移肿瘤细胞表面特有的糖蛋白。

糖分子能够与蛋白质的特定位点相结合。比如 N 连接多糖(N-glycans)就是与天冬氨酸(asparagine, N)结合的糖分子,而 O 连接多糖(O-glycans)则是与苏氨酸(threonine, T) 或丝氨酸(serine, S)结合的糖分子。科研人员们会使用各种不同的技术来研究糖蛋白,从而查看这些蛋白质都是在哪些情况下,在哪些位点上发生了糖基化修饰反应。

质谱检测技术

Bertozzi 和 Palaniappan 指出,用来鉴定蛋白质与糖结合的生物化学技术往往都需要人工操作的参与。核磁共振波谱法(NMR spectroscopy)、液相色谱技术(liquid chromatography)和电泳技术(electrophoresis)都可以用于鉴定哪些多糖与蛋白质结合的工作。但是,由于样品的复杂性,再加上其它一些因素,所以真正在糖蛋白研究的实际工作中使用这些技术难度很大。不过液相色谱与质谱技术联用是一个非常不错的替代方案。使用糖同系物分子(sugar analogs)进行代谢标记(metabolic labeling)并不会破坏细胞的生物学特性,但是却可以帮助科研人员分离出多糖分子,供后续的质谱分析使用。

化学实验手段还有助于解决糖基化修饰的复杂性和异质性问题,这也是目前面临的一大难题。糖蛋白是一种低丰度的、但是成份又非常复杂的混合体,因此研究人员很难得到足够量的糖蛋白进行实验分析。蛋白质的同一个位点可以结合多种不同的糖分子,而每一个单糖分子又可以以不同的方式与蛋白质结合。

在质谱实验中我们发现,糖分子可以抑制离子化。Bertozzi 因此设计了另外一种标记技术来解决这个问题,那就是插入一个二溴化物(dibromide )基序。为了使糖蛋白片段更容易被辨认,科研人员们往往会用非天然的糖分子同系物来标记细胞,同时再用二溴化物标记这些非天然的糖分子同系物。Bertozzi 希望让这种标记技术变的更加简便,以便让更多的科研人员使用这种技术。

据 Thermo Fisher 科技公司的流程设计师,同时也是化学家及糖科学研究者的 Julian Saba 介绍,在蛋白质和多肽研究领域,质谱技术是最为常见的一种试验手段,但是在糖分子研究领域却不是这样。Saba 同时表示,不过他们也差不多快到那一步了。因为有越来越多的新技术正在走出实验室。在一个肽段上可以结合 2 个,甚至是 100 个糖分子。这么多的糖分子会干扰质谱信号。肿瘤细胞也会通过各种不同的方式发生糖基化修饰,而且会随着不同的情况,改变这些糖基化修饰的方式,比如在转移的情况下。因此,科研人员们需要同时了解蛋白质和糖分子这两方面的信息。

出于好奇,Saba 也非常关注 PRIDE 等公共蛋白质组学数据库中储存的原始质谱数据。结果他发现,在肿瘤细胞的蛋白质里,有 2~20% 的数据都是糖基化相关数据,但是这些数据都很难解读,所以也很少有解读得比较好的数据。哪怕在靶向实验中,糖蛋白多肽离子也都非常少,很难产生质量比较高的数据信号,而且与其它非糖基化修饰的多肽信号相比,这些糖蛋白多肽离子的信号强度也要弱很多。

大部分质谱仪都是通过碰撞激活解离(collision-activated dissociation, CAD)的方式来使样品离子化的。但是 Saba 介绍,这种离子化方式会使糖分子解离得更加彻底,打断糖分子与蛋白质分子之间的结合键,这样一来,我们就无法得知哪些蛋白质才是发生了糖基化修饰的蛋白质了。所以,我们需要有一套专门的、针对糖蛋白的样品制备流程、样品富集策略和数据分析软件。可惜的是,哪怕是在最专业的糖分子研究实验室里也缺少上述这些条件。在 Thermo Fisher 科技公司里,糖蛋白组学研究的业务量也只能在质谱分析工作里排名第三。排前两名的分别是多肽鉴定和蛋白质组学定量分析业务。

Saba 还指出,酶可以帮助我们释放出多糖分子,但同时也会妨碍整个研究工序。当使用 PNGase F 等酶使糖分子从糖蛋白上解离下来的时候,与糖分子结合的天门冬酰胺(asparagine)就会转变成天冬氨酸(aspartic acid)。这就会产生大约 0.98 的质量漂移(mass shift),从而让科研人员以为发生了脱酰氨基作用(deamidization),这就说明该肽段是一个糖基化修饰的肽段。可问题在于,在样品制备过程中使用的试剂也会带来同样的脱酰氨基作用,因此,Saba 建议不要使用酶来分离糖分子,他建议不要去掉糖蛋白上的那些糖分子,因为这样会丢失很多与糖分子有关的重要信息。电子转移解离技术(electron-transfer dissociation, ETD)等样品解离技术,以及相关的多肽解离技术都可以很好地保留这些糖分子。

Saba 继续补充,如果希望使用质谱技术对糖分子进行更加精细的研究,也是非常困难的。当糖分子与蛋白质结合之后,质谱仪也无法解析其结构,因为质谱仪不能分析单糖分子之间的化学键。此时,如果将糖分子从糖蛋白上解离下来,就会容易得多。因此,如果要研究糖分子的复杂性问题,质谱技术并不是一个应用范围非常广的选择。在多肽链中,3 个氨基酸分子就可以有 6 种不同的结合方式,但是 3 个单糖分子却可以有 2 万种不同的结合方式。Saba 的团队正在设计一个更容易操作的糖科学研究流程,以便将来条件成熟时用于开展糖蛋白质组学研究工作。

目前,质谱技术还不是在糖分子研究中应用得非常普遍的一项技术。上图表示的就是从免疫球蛋白 G 分子上分离的糖分子的质谱分析结果,科研人员们可以根据这些峰图来辨认每一个片断。

糖组学计划(Glycome project)

英国牛津大学(University of Oxford)的科研人员 Raymond Dwek 在上世纪八十年代提出了“糖生物学(glycobiology)”这个概念。不过,据美国哈佛医学院(Harvard Medical School)的生化及糖生物学家 Richard Cummings 介绍,后来随着各种组学概念的出现,也有人提出了糖组学(glycomics)的概念。一直以来,我们都很难在实验室里合成糖分子,这也阻碍了糖科学研究的发展。不过 Cummings 之前在美国埃默里大学(Emory University)的科研团队发现,家用的漂白剂可以使组织上的糖分子解离下来。这种分离糖分子的能力也促进了糖组学的发展,科研人员们开始从各种健康和病理的样品中分离糖分子,从而了解其多样性信息。比如,有些科研人员就想了解糖组学的变化情况,以此来理解病理变化过程中血小板,或者免疫球蛋白糖组学的变化情况。Cummings 等人还在开发一种智能型的抗糖试剂(anti-glycan reagent),以用于免疫组化和流式细胞学实验,从而辨别糖分子和蛋白质分子。这些试剂都有助于科研人员构建人体糖组学数据库(Human Glycome Atlas),让我们对糖分子在人体内的分布有一个全面的、清楚的认识。

Cummings 后来又开始了一个新的项目,他称之为“抗糖组学(anti-glycome)”,即人体内所有与病原体碳水化合物发生过免疫反应的分子的集合。还有一个研究方向就是涉及所有植物和动物糖组学的比较糖组学(comparative glycomics)。Cummings 笑着指出,目前,糖科学研究已经从白银时期进入到了黄金时期,而且即将迎来白金时代。但他可是从陶器时代走过来的。不过,能够一路看到糖科学研究的蓬勃发展,也是非常欣慰的。

萨格勒布大学(University of Zagreb)的分子生物学家及糖科学家 Gordan Lauc 介绍,在上世纪初,碳水化合物研究也迎来了一个高峰。不过很快,科研人员们就把力量全都集中到了 DNA 和蛋白质研究上。但是和微生物组学(microbiome)一样,糖科学的春天也马上就要到来了。

Lauc 还指出,制药公司对糖科学的关注度不断加大,这也会推动糖科学的发展。制药公司都希望他们生产的单抗类药物都能够得到很好的、稳定的糖基化修饰,以避免不同批次的产品之间出现质量差异。但是培养条件哪怕发生一丁点变化,比如氧气浓度稍有扰动,就会改变蛋白质的糖基化修饰水平。

Marino 也表示,生物药品都是重组蛋白质类分子,这些分子在表达细胞内都会发生糖基化反应。但是不合适的糖基化反应就会改变这些蛋白质的半衰期,也会影响这些蛋白质的免疫原性。而且改变糖修饰方式还会改变蛋白质很多其它特性,比如改变单抗分子与免疫系统之间的相互作用等。所以我们也可以利用这种糖基化修饰机制对蛋白质进行改造。

不过 Lauc 认为这种可能性还太遥远,短期内难以实现。因为这需要科研人员们了解如何通过不同的糖基化修饰反应赋予被修饰蛋白质不同的特性。这就需要在糖科学基础研究方面有所突破。Lauc 自己也成立了一家名为 Genos 的公司,他那个拥有 40 名科研人员的实验室就是该公司的实验室。他们实验室主要为欧盟和美国的科研机构提供科研服务。该实验室也是欧洲糖科学论坛(Euroglycoscience Forum)项目的成员。该项目主要将欧洲各个从事糖科学研究的实验室联系起来,不过已于 2014 年结束。后续的项目主要集中在人体糖组学方向,主要研究不同的糖基化修饰都具有哪些生物医学功能的问题。

据 Lauc 介绍,人体内含有 1000 万至 1 亿种不同的糖蛋白。所以,我们离看到整个人体糖组都还有相当大的距离。Lauc 目前正在研究与免疫球蛋白 G 糖基化有关的糖组学问题,这一方面是因为免疫球蛋白 G 非常重要,同时也是因为我们已经对其功能有了一个比较清楚的认识。比如,糖基化可以调节免疫球蛋白 G 的免疫反应。Lauc 对 3 万人的免疫球蛋白 G 糖基化数据进行了分析,并准备进一步将规模扩大到 10 万人。他的数据来源就是欧洲各个生物数据库,比如 TwinsUK study 项目中的 4500 人的信息等。

Lauc 团队将糖基化数据与表型、遗传数据和生物化学数据相结合,来研究不同的年龄,或者不同的生活方式对糖组学的影响,以及慢性炎症、高血压、肿瘤、红斑狼疮等不同生理条件对糖组学的影响。

Lauc 团队还将分析化学与生物信息学技术结合起来,开展了高通量的糖科学分析工作。样品的质量也非常重要。化学家们希望与临床医生们开展合作,获得更多的样品,以开展更高质量的统计学分析。Lauc 团队就使用了统计学方法、质谱技术和荧光标记液相色谱等手段。其中色谱技术是最主要的研究手段,因为这种检测技术的测量误差最小。虽然质谱技术也非常强大,但是 Lauc 发现用质谱分析大量样品时,结果的稳定性不够。

由于蛋白质会发生各种各样的糖基化修饰,因此,可以说人体糖组学是给人体基因组学又额外增添了一层信息。当然,可能还有更多层的信息。Lauc 正在研究糖基化修饰对表观遗传学修饰的影响作用。他们使用的基因组数据分属于不同的数据库,他们实验室的糖组学数据也储存在他们自己的服务器上。将这些不同的数据进行集中分析,这也是一项难度不小的工作,除此之外,分享糖科学的数据也不容易。比如,整个糖科学界还在研究如何给不同的糖结构命名。由此可见,检阅相关的资料真的不是一件容易的工作。

虽然有很多储存糖科学数据的数据库,但目前还没有一个类似于 GenBank 这样的大型、集中的数据库。Lauc 表示,他们也非常需要这种大型的、公共的数据库。

数据利用

美国乔治华盛顿大学(George Washington University)的生物信息学家 Raja Mazumder 认为,这些数据应该让更多的人理解,而不应该只属于生产这些数据的博士后们。Mazumder 和佐治亚大学(University of Georgia)的 William York 都获得了糖科学信息学方向的基金资助,他们对世界范围内的科研人员进行了一番调研之后决定,共同搭建一个糖科学分析软件的网络共享社区。

为了发现与肿瘤相关的糖分子改变,各个实验室都对各种肿瘤细胞的糖基化修饰情况进行了分析和研究,也就是做了一番类似于肿瘤基因组学研究的工作。但是就目前我们已经掌握的肿瘤糖基化研究情况来看,相关科研人员常常都不知道该去哪些蛋白质数据库、信号通路数据库,或者结构数据库里寻找哪些有用的信息。因为这太复杂了。

只有将有关糖分子的计算机资源与海量的基因组和基因表达数据资源相结合,才有可能更好地理解糖分子的生物学意义。如果有一个实验室发现,糖分子结合于糖蛋白的第 92 号位点,那么他们接下来就应该了解乳腺癌细胞内的该糖蛋白是否是在这个位点上发生了突变,该突变是否影响了蛋白的糖基化反应。

或者,有一个实验室可能会发现,健康人体的蛋白在某个位点不会发生糖基化修饰,但是如果发生了癌变,该位点就会进行糖基化修饰。还有一些科研人员可能很想了解某个基因在小鼠中是否是一个保守的基因。也有些科研人员可能会去 UniProt 这样的蛋白质数据库里寻找,蛋白质的某个位点上是哪一种氨基酸。但是这些数据库都不会提供相应的基因组数据信息,这些数据也都是静态的数据,而不会提供不同个体遗传变异方面的信息。蛋白质和糖分子也会根据组织来源的不同而发生变化。据 Mazumder 介绍,将不同的数据综合起来分析,得出一个全面的结论,真的非常非常困难。因此,他们才决定建立一个综合性的网络社区,来解决这个问题。

开发工具酶

NEB 公司(New England Biolabs, NEB)的糖科学家 Paula Magnelli 认为,开发生物疗法和重组糖蛋白才是各个实验室努力研究糖分子和糖蛋白的根本驱动力。NEB 公司和她们公司的创始人 Donald Comb 关注糖科学研究已有很长一段时间了。生物学很多其它的研究方向也带来了一些影响,因为这些研究工作中也会碰到糖的问题。美国国家研究战略委员会的路线图就指出,我们急需一整套工具酶,来帮助我们从事糖科学研究。目前也出现了一些学术性资源,比如佐治亚大学的复杂碳水化合物研究中心(Complex Carbohydrate Research Center of the University of Georgia)就构建了一个资源库,里面保存了很多糖相关酶表达系统(glyco-enzyme expression constructs)。Sigma-Aldrich、Thermo Fisher、Amsbio MP Biomedicals 以及 NEB 这些生物科技公司也都提供了糖科学研究相关的工具酶。

NEB 公司的化学家 Stephen Shi 指出,这些工具酶非常重要,因为科研人员们不能像做核酸实验,或者蛋白质实验那样来控制各种糖分子。在碳水化合物研究领域,这些与酶有关的研究包括使用糖苷酶(glycosidases)类降解特定的糖苷键,使用内切糖苷酶(endoglycosidases)将糖分子与肽链分离,以及使用外切糖苷酶(exoglycosidases)将多糖分子降解成单糖分子等。这些酶可以用来进行糖分子鉴定,也有可能可以帮助工程师们构建预定义的糖分子(predefined glycan)。

据 Shi 介绍,很多与糖科学有关的工业酶都是在上世纪七八十年代开发的。比如外切糖苷酶就来源于牛肾和牛睾丸等动物组织。还有一些工业酶是酶混合物,其中的具体成分现在还不得而知。4 年前,NEB 公司又进一步扩展了他们的糖科学工业酶产品线,并且利用他们公司标准的蛋白重组技术、纯化和鉴定技术,保证了产品质量的稳定性。科研人员们在选购工业酶时,一定要选择经过充分验证过的,而且制造工艺和纯化工艺都有保证的产品。

由于存在很多种酶,而且实验设计方面也存在偏差,所以 NEB 公司也正在开发标准化的试剂盒。Magnelli 表示,一次实验可能就需要用到 96 孔板这样的试剂盒,而且其中每一个孔里都含有好几种不同的酶。同一个样品在不同的反应孔里会发生不同的反应,这样就可以为科研人员提供丰富的糖分子结构信息。在开发工具酶时,NEB 公司一直也都牢记着实验流程的需要,比如有一些酶的反应体系就与质谱仪不兼容。

糖一直是 Magnelli 的兴趣之所在,当然也是其他糖科学家们关注的焦点。基因组分析已经告诉我们有哪些基因,但是我们还需要了解更多更深层次的问题,比如肿瘤细胞的变化,阿尔茨海默病的进展等。糖分子总是与蛋白质结合在一起,Magnelli 认为,不论在生物体内还是在细胞里,DNA 都只是剧本,而蛋白质才是演员。只有充分认识了这些活体内的蛋白质,我们才有可能更好地认识糖分子,因为演员(蛋白质)从来都不会‘赤身裸体’上台的。

;