新闻 Company News

疾病研究的多组学视角

发布时间:2020-06-15 09:20:04 | 来源:【药物研发团队 2020-06-15】
分享至:0

疾病是一个极其复杂的过程,许多情况下,从健康到疾病是一个由量变到质变的过程。当外界致病因素作用于细胞,达到一定强度或持续一定时间,也就是说,致病因素有了一定量的积累就会引起细胞的损伤,这个被损伤的细胞出现功能、代谢、形态结构紊乱,是在一定病因作用下机体自稳调节紊乱而发生的异常生命活动过程,并引发机体一系列代谢、功能、结构的变化,表现为症状、体征和行为的异常。

人类在与疾病的长期斗争中积累了丰富的经验,取得了显著成效,人类探索病因病机的步伐始终没有停歇。但是,人体的奥秘仍然未被揭开,对许多疾病的认识仍然不清楚,“有时去治愈,常常去帮助,总是去安慰”道出了医者的无奈。

20世纪50年代以来,从分子水平研究生物大分子的结构与功能从而阐明生命现象本质的分子生物学成为生物学的前沿与生长点,得到快速发展,人们开始试图从基因这个微观世界去破解生命现象和疾病的本质而不能自拔,涌现出一大批基于分子靶向的疾病治疗药物和治疗方法,有效地阻遏了一些疾病的发生和发展。但是,“有时去治愈,常常去帮助,总是去安慰”的情况仍然没有得到根本扭转,一些重大复杂疾病仍然无法治愈,一些疾病虽然被暂时抑制,但由于耐药等原因又导致疾病复发。究其原因,现代医学过于追求对微观世界的理解和认识,过于强调对疾病进行孤立地溯源,忽视了疾病与病人、微观与宏观、局部与整体的关系。因此,除了科学技术的发展,对探索生命现象和疾病本质的方法学进行深入研究,应当成为亟待解决的重要课题。

人类基因组计划是在研究人类过程中建立起来的策略、思想与技术,构成了生命科学领域新的学科—基因组学。随着人类基因组计划的完成,各种组学研究也相继展开。

细胞是生物体基本的结构和功能单位,细胞由细胞核、细胞质、细胞膜构成。研究细胞核的领域称为基因组学,研究细胞质的领域称为蛋白质组学,研究细胞膜的领域称为多糖组学。基因组学、蛋白质组学、多糖组学并列为生命科学的“三大组学”。基因组学是专门研究细胞“遗传物质”的,蛋白质组学是专门研究细胞“基础物质”的,多糖组学主要研究细胞“信息物质”。  除此之外,还有表观基因组学、结构基因组学、代谢组学、转录组学、脂质组学、免疫组学、 RNA组学、化学基因组学、功能基因组学、影像组学、超声组学等也得到快速发展。

随着科学研究的进展,人们发现单纯研究某一方向(基因组,蛋白质组,转录组等)无法解释全部生物医学问题,科学家就提出从整体的角度出发去研究人类组织细胞结构、基因、蛋白及其分子间相互的作用,通过多组学的联合应用,整体分析反映人体组织器官功能和代谢的状态,为探索人类疾病的发病机制提供新的思路。

一、多种组学简介

(一)基因组学

基因组学是对生物体所有基因进行集体表征、定量研究及不同基因组比较研究的一门交叉生物学学科。基因组学主要研究基因组的结构、功能、进化、定位和编辑等,以及它们对生物体的影响。

基因组学的目的是对一个生物体所有基因进行集体表征和量化,并研究它们之间的相互关系及对生物体的影响。基因组学还包括基因组测序和分析,通过使用高通量DNA测序和生物信息学来组装和分析整个基因组的功能和结构。基因组学同时也研究基因组内的一些现象如上位性(一个基因对另一个基因的影响)、多效性(一个基因影响多个性状)、杂种优势(杂交活力)以及基因组内基因座和等位基因之间的相互作用等。

基因组学的进步引发了以发现为基础的研究和系统生物学领域的一场革命,促进了对大脑等最复杂生物系统的理解。基因组学与转录组学、蛋白组学和代谢组学一起构成了系统生物学的组学基础。

基因组学的主要工具和方法包括生物信息学,遗传分析,基因表达测量和基因功能鉴定。

(二)转录组学

转录组学是在整体水平上研究细胞中基因转录的情况及转录调控规律的学科。转录组学是从RNA水平研究基因表达的情况。转录组即一个活细胞所能转录出来的所有RNA的总和,是研究细胞表型和功能的一个重要手段。以DNA为模板合成RNA的转录过程是基因表达的第一步,也是基因表达调控的关键环节。所谓基因表达,是指基因携带的遗传信息转变为可辨别的表型的整个过程。与基因组不同的是,转录组的定义中包含了时间和空间的限定。同一细胞在不同的生长时期及生长环境下,其基因表达情况是不完全相同的。

人类基因组包含有30亿个碱基对,其中大约只有5万个基因转录成mRNA分子,转录后的mRNA能被翻译生成蛋白质的也只占整个转录组的40%左右。通常,同一种组织表达几乎相同的一套基因以区别于其他组织,如脑组织或心肌组织等分别只表达全部基因中不同的30%而显示出组织的特异性。

转录组谱可以提供什么条件下什么基因表达的信息,并据此推断相应未知基因的功能,揭示特定调节基因的作用机制。通过这种基于基因表达谱的分子标签,不仅可以辨别细胞的表型归属,还可以用于疾病的诊断。例如:阿尔茨海默病(AD)中,出现神经原纤维缠结的大脑神经细胞基因表达谱就有别于正常神经元,当病理形态学尚未出现纤维缠结时,这种表达谱的差异即可以作为分子标志直接对该病进行诊断。同样对那些临床表现不明显或者缺乏诊断金标准的疾病也具有诊断意义,如自闭症。对自闭症的诊断要靠长达十多个小时的临床评估才能做出判断。基础研究证实自闭症不是由单一基因引起,而很可能是由一组不稳定的基因造成的一种多基因病变,通过比对正常人群和患者的转录组差异,筛选出与疾病相关的具有诊断意义的特异性表达差异,一旦这种特异的差异表达谱被建立,就可以用于自闭症的诊断,以便能更早地,甚至可以在出现自闭症临床表现之前就对疾病进行诊断,并及早开始干预治疗。转录组的研究应用于临床的的另一个例子是可以将表面上看似相同的病症分为多个亚型,尤其是对原发性恶性肿瘤,通过转录组差异表达谱的建立,可以详细描绘出患者的生存期以及对药物的反应等。

用于转录组数据获得和分析的方法主要有基于杂交技术的芯片技术包括cDNA芯片和寡聚核苷酸芯片,基于序列分析的基因表达系列分析SAGE (SAGE)和大规模平行信号测序系统MPSS(MPSS)。

(三)蛋白质组学

蛋白质组学是以蛋白质组为研究对象,研究细胞、组织或生物体蛋白质组成及其变化规律的科学。蛋白质组(Proteome)一词,源于蛋白质(protein)与 基因组(genome)两个词的组合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。蛋白质组学本质上指的是在大规模水平上研究蛋白质的特征,包括蛋白质的表达水平,翻译后的修饰,蛋白与蛋白相互作用等,由此获得蛋白质水平上的关于疾病发生,细胞代谢等过程的整体而全面的认识。

蛋白质组的研究不仅能为生命活动规律提供物质基础,也能为众多种疾病机理的阐明及攻克提供理论根据和解决途径。通过对正常个体及病理个体间的蛋白质组比较分析,我们可以找到某些“疾病特异性的蛋白质分子”,它们可成为新药物设计的分子靶点,或者也会为疾病的早期诊断提供分子标志。因此,蛋白质组学研究不仅是探索生命奥秘的必须工作,也能为人类健康事业带来巨大的利益。蛋白质组学的研究是生命科学进入后基因时代的特征。

(四)代谢组学

代谢组学是效仿基因组学和蛋白质组学的研究思想,对生物体内所有代谢物进行定量分析,并寻找代谢物与生理病理变化的相对关系的研究方式,是系统生物学的组成部分。代谢组学主要研究的是作为各种代谢路径的底物和产物的小分子代谢物(MW<1000)。先进分析检测技术结合模式识别和专家系统等计算分析方法是代谢组学研究的基本方法。

代谢组学的概念来源于代谢组,代谢组是指某一生物或细胞在一特定生理时期内所有的低分子量代谢产物,代谢组学则是对某一生物或细胞在一特定生理时期内所有低分子量代谢产物同时进行定性和定量分析的一门新学科。它是以组群指标分析为基础,以高通量检测和数据处理为手段,以信息建模与系统整合为目标的系统生物学的一个分支。

代谢组学是继基因组学和蛋白质组学之后新近发展起来的一门学科,是系统生物学的重要组成部分。之后得到迅速发展并渗透到多项领域,比如疾病诊断、医药研制开发、营养食品科学、毒理学、环境学、植物学等与人类健康护理密切相关的领域。基因组学和蛋白质组学分别从基因和蛋白质层面探寻生命的活动,而实际上细胞内许多生命活动是发生在代谢物层面的,如细胞信号释放、能量传递、细胞间通信等都是受代谢物调控的。代谢组学正是研究代谢组在某一时刻细胞内所有代谢物的集合的一门学科。基因与蛋白质的表达紧密相连,而代谢物则更多地反映了细胞所处的环境,这又与细胞的营养状态、药物和环境污染物的作用,以及其它外界因素的影响密切相关。因此有人认为,“基因组学和蛋白质组学告诉你什么可能会发生,而代谢组学则告诉你什么确实发生了。”

(五)表观基因组学

几十年来,DNA一直被认为是决定生命遗传信息的核心物质,但是近些年新的研究表明,生命遗传信息从来就不是基因所能完全决定的,比如科学家们发现,可以在不影响DNA序列的情况下改变基因组的修饰,这种改变不仅可以影响个体的发育,而且还可以遗传下去。这种在基因组的水平上研究表观遗传修饰的领域被称为表观基因组学。表观基因组学使人们对基因组的认识又增加了一个新视点:对基因组而言,不仅仅是序列包含遗传信息,而且其修饰也可以记载遗传信息。

(六)结构基因组学

结构基因组学是以全基因组测序为目标,确定基因组的组织结构、基因组成及基因定位的基因组学的一个分支。它代表基因组分析的早期阶段,以建立具有高分辨率的生物体基因组的遗传图谱、物理图谱及转录图谱为主要内容。以及研究蛋白质组成和结构的学科。

(七)免疫组学

免疫组学是研究免疫相关的全套分子库,它们的作用靶分子及其功能,免疫组学包括了免疫基因组学、免疫蛋白质组学和免疫信息学三方面的研究,特别强调在基因组学和蛋白质组学研究的基础上,充分利用生物信息学、生物芯片、系统生物学、结构生物学、高通量筛选等技术对免疫组学进行研究。

(八)脂质组学

脂质组学是对整体脂质进行系统分析的一门新兴学科,通过比较不同生理状态下脂代谢网络的变化,进而识别代谢调控中关键的脂生物标志物,最终揭示脂质在各种生命活动中的作用机制。

电喷雾电离-质谱技术是脂质组学领域中最核心的研究手段, 已能对各种脂质尤其是磷脂进行高分辨率、高灵敏度、高通量的分析。随着质谱技术的进步,脂质组学在疾病脂生物标志

物的识别、疾病诊断、药物靶点及先导化合物的发现和药物作用机制的研究等方面已展现出广泛的应用前景。

(九)多糖组学

现代科学研究发现,细胞膜表面附着大量的多糖体,这些多糖体具有识别、判断、传递信息的特殊功能,从而控制细胞间的信息交流和控制物质进出细胞、控制细胞分泌、排泄、免疫等重要功能。

糖类物质是组成生物体的基本物质之一,在各种生命活动中发挥着重要作用。目前还没有一种生命体能离开糖类物质而存在,糖类不仅是细胞能量的主要来源,而且在细胞的构建、细胞的生物合成和细胞生命活动的调控中均扮演着重要的角色。多糖组学是从分析和破解一个生物或一个细胞特定阶段全部糖类物质所含信息的角度入手,研究糖类物质的分子结构、微观不均一性、表达调控、与识别分子的相互作用和功能多样性以及其与疾病之间关系的科学。因此多糖组学研究的内容不仅仅需要获取一个生物体在某一时期或某一状态下所表达的糖组,而且还需要进一步解析糖组各组分产生的原因以及产生的生物学功能和意义。

多糖组学研究在全面系统了解生物体生命活动过程中不可或缺,几乎所有的微生物和病毒都是通过附着于细胞表面的糖链而对人类造成感染,糖组学将对未来研究传染性疾病的诊断和预防产生极大的影响。人类基因组谱图绘制完成后,相关研究进入后基因组时代,即解析不同组织器官在不同时期的蛋白质表达及其功能分析。但随着蛋白质组研究的逐步成熟,人们又开始意识到蛋白质结构和功能会受到蛋白质翻译后修饰的调控。蛋白糖基化修饰就是其中最重要的蛋白质修饰之一。因此多糖组学研究是蛋白质翻译后修饰组学研究的重要内容之一。但从另一个角度出发,糖类物质的合成虽然不受基因组的直接控制,但却受到基因编码的糖基转移酶、糖苷酶和磺基转移酶等糖类物质相关基因的表达调控。另外,还有一类与糖蛋白糖链或糖脂糖链发生相互作用的蛋白质,被称为糖结合蛋白或凝集素,具有调控细胞间的识别、信号传递、细胞的内吞和细胞内物质运输以及外界病原微生物的感染等生物学功能。因此在多糖组学研究过程中,有必要同时考虑相关糖基因和糖结合蛋白表达的变化情况。细胞表面糖蛋白和糖脂上的糖链是信息功能的呈递者,发挥着细胞-细胞和细胞-胞外基质信息传递的作用。糖链作为信息分子涉及多种类型细胞生命的全部空间和时间过程,如精卵识别、组织器官形态形成和老化以及癌症等疾病的发生。从生物体生命活动全面性分析的角度出发,多糖组学与基因组学、蛋白质组学、脂质组学及其代谢组学等组学研究相互补充,密不可分。

与基因和蛋白质相比,糖类物质具有结构多样性、复杂性和微观不均一性,其一级结构不仅包括糖基的排列顺序,还包括各糖基本身异头体的构型、各糖基间的连键方式以及分支糖链的结构等。糖类物质结构的复杂性给其结构表征带来了巨大的困难,因此多糖组学研究相对缓慢。但随着现代仪器分析技术的发展,糖类物质自身结构和其在生命活动中的各种重要作用不断被解析和发现,例如,糖蛋白及其糖基化位点上糖链结构的分析新技术和糖蛋白糖链能调节蛋白质的空间结构、正确折叠、保护多肽链不被蛋白酶水解、防止与抗体结合、细胞内定位、细胞-细胞黏附和结合病原体等。但目前对存在于神经组织及大脑中的糖脂糖链结构及其生理意义的了解并不多。总体来说,多糖组学与基因组和蛋白质组学一样,成为全面了解生命基础的重要一环, 其在国内外受到越来越多的关注,将对疾病及疾病治疗研究产生重要影响。

(十)RNA组学

传统观念认为:三类最重要的生物高分子化合物中,DNA携带遗传信息,蛋白质是生物功能分子,而RNA在这二者间起传递遗传信息功能(即参与蛋白质的生物合成)。

20世纪80年代初,T.Cech发现RNA也可成为生物催化剂,他称之为核酶。在酶学领域,核酶的发现打破了多年来"酶的化学本质就是蛋白"的传统观念。在RNA领域这一发现对传统观念的冲击更大,它使人们认识到,RNA的生物功能远非"传递遗传信息"那么简单。此后,RNA研究领域不断出现新发现:RNA控制着蛋白质的生物合成、RNA具运动功能、RNA具调控功能、RNA调控遗传信息、RNA修饰、RNA携带遗传信息、RNA与疾病的关系、基因组研究中的"垃圾"可能是RNA基因。在此背景下,RNA组学应运而生。

RNA组学是对细胞中全部RNA分子的结构与功能进行系统的研究,其主要任务是从整体水平阐明RNA的生物学意义。RNA组学研究将会在探索生命奥秘和促进生物技术产业化中做出巨大贡献。如果说基因组学研究正全力构筑生命科学基石的话,那么RNA组学研究则是它不可缺少的同盟军。

(十一)化学基因组学

化学基因组学(Chemical Genomics)是一个自90年代中期以来的新兴学科。该词是由英文翻译而来的,在英语语境下Chemical Genomics这一学科近似并从属于Chemical Biology(即:化学生物学)这一学科,且二者并没有明显界限,因此中文可将化学基因组学理解或翻译为化学生物学,二者同属化学学科大类下的二级学科。该学科的思路是:采用化学的手段或方法,如运用小分子或人工设计合成的分子作为配体来直接影响或改变生物的功能。

传统的生物学或生物化学,通常是研究生物体本身的化学机制和过程,或利用基因本身的手法,将基因表达后,探讨生物体分子内的交互作用、调控机制等。而化学基因组学(化学生物学)则是利用化学方法解决生物学问题,是人为的采用有机化学的方式,进行分子的合成,进而探讨这些分子对于生物内反应本身的作用。

化学基因组学通过小分子化合物探针与靶蛋白之间的特异性相互作用,在基因的转录、加工和翻译等水平上对细胞的某一特定生命过程进行调控,从而研究靶蛋白及相关目的基因的结构与功能,同时发现和确认新的药物作用靶点及药物先导化合物。化学基因组学因其可控制性、可检测性和可定量性而具有以全新的方式大规模的快速寻找和发现新基因和功能蛋白质,并研究其功能和调控网络的优势,因此它不仅是研究功能基因组学的一条捷径,而且也是药物发现的有效手段。

(十二)功能基因组学

功能基因组学又可称为后基因组学,是指基于基因组序列信息,利用各种组学技术,在系统水平上将基因组序列与基因功能(包括基因网络)以及表型有机联系起来,最终揭示自然界中生物系统不同水平的功能的科学。   

功能基因组用功能不明的分离基因作为起始点,然后选择具有该同源基因的生物模型。这一生物模型可以是简单的酵母细胞或复杂的线虫甚至老鼠。基因被选择性的用多种遗传技术灭活,在此生物体上选择性去除的效果被确定。通过这种方法去除基因,它对生物功能的贡献就能够被识别。功能基因组在评估和检测新药时十分有用。在另一种方法中,一整套基因被系统地灭活,人们就可以检测其对特定细胞功能的影响,从而同时识别一个新的基因及其功能。

基因组(GENOME)一词是1920年Winkles从GENes和chromosOEs铸成的,用于描述生物的全部基因和染色体组成的概念。1986年美国科学家Thomas Roderick提出的基因组学(Genomics)是指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录本图谱)、核苷酸序列分析、基因定位和基因功能分析的一门科学。因此,基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics),成为系统生物学的重要方法。

功能基因组学利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入对基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育功能,如参与形态建成等。

功能基因组学采用的手段包括经典的减法杂交、差示筛选、cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析,新的技术应运而生,包括基因表达的系统分析(SAGE),cDNA微阵列、DNA 芯片和序列标志片段显示技术、微流控芯片实验室等。

(十三)影像组学

影像组学是指采用高通量方法提取大量具有疾病特征性的影像资料进行研究的学科,它应用大量的自动化数据特征化法将感兴趣区域的影像数据转化为具有高分辨率的特征空间数据。数据分析是对大量的影像数据进行数字化的定量高通量分析,得到高保真的目标信息来综合评价疾病的各种表型,包括组织形态、细胞分子、基因遗传等各个层次。

其核心理论基础是影像组学模型,包含有病灶的生物学或医学数据信息,借此能为疾病的诊断、预后及预测提供有价值的信息,将在疾病的诊断、治疗中发挥重要作用。

(十四)超声组学

超声组学是人工智能时代的超声医学大数据分析方法,它作为影像组学的一个分支,旨在利用数据特征算法对超声图像进行自动化数据特征分析及高通量特征提取,并利用深度学习或机器学习的分析方法建立智能辅助临床决策的系统。

二、疾病研究中的多组学联合应用

对于发病原因复杂的疾病通常很难用单一的理论模式进行表述。系统生物学研究的引进为其发病机制的研究提供了新思路。系统生物学是通过整合生物系统中诸多相互联系和作用的组分来研究复杂生物过程的机制,即研究生物系统中所有组成成分(基因、RNA、蛋白质和代谢产物等)的构成以及在特定条件下这些组分间的相互作用和关系,并分析生物系统在某种或某些因素干预扰动下在一定时间内的动力学过程及其规律。高通量的组学(Omics)技术为系统生物学提供了海量的实验数据和先进的技术方法。

单纯研究某一层次生物分子(核酸、蛋白、小分子代谢物等)变化,然后通过分析基因功能及相互作用网络,或通过分析小分子代谢产物的相互关系并找寻生物标志物等,已经很难满足系统生物学越来越高的研究期望。

高通量测序、人工智能、大数据、云计算等技术的快速发展和不断完善,为组学研究及多组学联合应用提供了强大的科技支撑。通过对基因组、转录组、蛋白组和代谢组等多组学实验数据进行整合分析,可获得应激扰动、病理生理状态或药物治疗疾病后的变化信息,富集和追索到变化最大、最集中的通路,通过对基因到RNA、蛋白质,再到体内小分子,对整体变化物质分子进行综合分析,包括原始通路的分析及新通路的构建,反映出组织器官功能和代谢状态,从而对生物系统进行全面的解读。从多分子层次出发,多组学联合应用,系统研究基因、RNA、蛋白质、多糖、脂质和小分子等之间的相互作用和系统机制为疾病研究及疾病治疗提供了新的方向和新的方法。


本文综合整理自南昌弘益药业研发团队。欢迎转发,禁止转载。转载授权请联系0791-88161315




版权所有© 南昌弘益科技有限公司 网站技术支持:云端科技

赣ICP备15005709号-1 互联网药品信息服务资格证书编号:赣A202207910060

友情链接:国家食品药品监督管理局国家科技部网站 国家食品药品监督管理局药品审评中心 江西省食品药品监督管理局中国生物技术发展中心


赣公网安备 36010902000143号