[生物产业]DNA“暗物质”的进化

发布日期:2014-01-23

基因的“经典”作用是,生成对细胞功能至关重要的蛋白质。不过,我们的基因组也编码了一些生成长链非编码 RNAs 的基因,它们的功能颇为神秘。自 4、5 年前人们知道在人类和小鼠的基因组中存在有数以千计、这样仍了解甚少的基因以来,一直想了解它们是如何被激活的?以及在哪些器官中被激活?这样的生物学“暗物质”有无意义?

日前,来自瑞士洛桑大学、洛桑联邦理工学院(EPFL)和瑞士生物信息学研究所(SIB-SIB)的科学家们研究了这些知之甚少的基因类型的功能。他们发现,其中一些基因历经进化过程保存下来,存在于从人类到青蛙等 11 个物种之中。

在这项刊登在《自然》(Nature)杂志上的研究中,论文资深作者、瑞士洛桑大学整合基因组学中心(CIG)的Henrik Kaessmann 教授和他的同事们编译出了 11 个物种长链非编码 RNAs 的目录。通过采用一种进化方法,他们发现大约有 2500 种长链非编码 RNAs 最早出现在至少 9000 万年前大多数有胎盘类哺乳动物(Placental Mammal)的共同祖先之中。从功能的角度来看,这些“古老”的基因具有特别的意义。

论文第一作者、洛桑联邦理工学院的 Anamaria Necsulea 将这些长链非编码 RNAs 的调查范围扩展至涵盖 6 种灵长类动物(人类、猕猴、黑猩猩、倭黑猩猩、大猩猩和猩猩)、小鼠、负鼠、鸭嘴兽,以及由鸡和青蛙组成的一个“外延组”。所有这些物种的共同祖先可追溯至 3.5 亿多年前。

在进化过程中保留的基因

生物学家们利用 CIG 的基因组学平台和 SIB-SIB 的重要 IT 计算机中心,鉴别了调查的 11 个物种几种主要器官中的长链非编码 RNAs 。 Necsulea 说:“多亏有了生物信息学,我们发现了以往未定位出任何基因的基因组位点生成的一些 RNA 序列。我们随后分析了这些基因,确定了它们是否编码蛋白质。由此,根据不同的物种,我们鉴别出了 3000- 15000 种非编码 RNA 基因。”

在研究的第二阶段,通过比较不同的物种科学家们精确地找到了这些基因在进化史中出现的位置。有 11000 种长链非编码 RNAs 为所有灵长类动物所共有,2500 种可追溯至大约 9000 万年前人类和小鼠的共同祖先。只有100种这样的基因起源于所有 11 个物种的共同祖先。“其中一个重要的研究发现是,调控蛋白质编码基因活性的相同转录因子也控制了这些非编码基因的活性。更令人注目的是,我们发现有 2500 种最古老的长链非编码 RNA 基因受到对于胚胎发育至关重要的一些因子的调控。这表明,在有胎盘类哺乳动物进化过程中保存下来的2500种长链非编码 RNAs 里,相当大一部分有可能在胚胎发育中特异性地发挥功能。”

互作新网络

在研究的第三阶段,科学家们阐明了包括长链非编码 RNAs 和蛋白质编码基因的一个互作网络。他们发现,一些非编码基因与参与大脑功能或精子发生的一些蛋白质编码基因密切相关,表明这些长链非编码 RNA 基因具有一些相似的功能。

就本研究中鉴别的一种最古老的长链非编码 RNA 基因—— H19X 基因来说,它与有胎盘类哺乳动物 H19 基因有关联,帮助揭示了它的功能。Necsulea 说:“H19 阻止了胎盘在母体子宫内过度生长。我们可以推测 H19X 也促成了这一功能。我们现在计划在小鼠中让这一基因丧失功能,以测试它在胎盘中所起的作用。”

在 RNA 生成基因子类别中,这些长链 RNA 基因是否比最原始时更有用?通过在 11 种不同的物种中追踪它们,新研究以前所未有的规模揭示了,我们基因组的一些“暗物质”似乎在发育以及人体最重要的一些器官的功能中发挥作用。未来的实验研究将进一步阐明才向我们显露它们首批秘密的这些基因的作用。