产品分类
您现在的位置:首页 > 技术文章 > 人类基因组远比基因更复杂
人类基因组远比基因更复杂
  • 发布日期:2012-09-11      浏览次数:1471
    •   由美国人类基因组研究所资助的一个规模巨大的性项目,称为DNA元素百科全书(ENCODE),9月5日,有6篇论文在《自然》、24篇论文在《基因组研究和基因组生物学》、2篇论文在《科学》发表。32个机构和442个研究人员,参加了这个项目的研究。该项目发现:人类基因组DNA,包括略少于21000个蛋白质编码基因,8800个小RNA分子,9600个长非编码RNA分子,11224个假基因。只有不到3%的基因组的基因,能够编码蛋白质。约有80%的基因组是具有生物活性的。基因组DNA的76%转录成多种RNA。部分碱基,转变成RNA链,执行基因调控等功能。许多碱基在人类生物学中起作用,如有助于决定一个基因的起动和终止。许多碱基仅落在化学修饰的位置,成为染色体的一些沉默片段。绝大多数碱基,没有什么用处。400万个位点是控制基因活性的开关,给每一类型细胞以*的基因组标识。创建的ENCODE图谱,可以放大查看自染色体到单个碱基和开关,那些碱基是否产生RNA,或是在哪些地方与DNA调控蛋白相结合。一些科学家,正在利用ENCODE的信息于多种疾病和表观遗传学的研究。ENCODE的研究结果,将改变人们对人类基因组的思维方式
        
        伊利莎白·派尼茜(ElizabethPennisi),美国科学促进协会,2012年9月5日
        
        一个规模巨大的项目已经发现,人类基因组——1个人遗传信息的总和——在学校学习的青少年的基因组,含有比编码蛋白质的基因多得多的遗传信息。20世纪90年代后期,研究人员决定对人类基因组进行序列测定,那时,他们专注于发现那些传统意义上的基因,以便鉴定出生命必须的全部蛋白质。每一个基因,被认为是一个离散的DNA片段;它的DNA碱基的顺序——大家所熟悉的“字母”分子是构建DNA片段的元素——认为是用于编码一种特定的蛋白质。但是,破译人类基因组的科学家们发现,令他们惊讶的是,只有不到3%基因组的基因,能够编码蛋白质。其中,其他的数十亿碱基,几乎是没有用处的。
        
        现在,一个美资项目,称为DNA元素百科全书(ENCODE),不管怎么说,他们已经发现了许多碱基,在人类生物学中起着作用:例如,它们有助于决定一个基因的启动和终止。例如,它可以调节一个肾细胞或另一个脑细胞。耶鲁大学的生物信息学家马克·格斯坦(MarkGerstein)说:“基因组远比基因更复杂。”
        
        来自这个项目的真知灼见,有助于研究人员了解疾病和遗传之间的关系。位于英国辛克斯顿的欧洲生物信息学研究所的生物信息学家伊万·伯尼(EwanBirney)说:“我们正被告知研究疾病的一种方法,除此之外,这将是非常困难的。”
        
        作为ENCODE的组成部分,32个机构做计算机分析、生化测试和142个细胞类型的测序研究——6个是相当广泛地——找出30亿个碱基中的每一个碱基的功能。ENCODE的442个研究人员,今天(2012年9月5日)在《自然》杂志报告,约有80%的基因组是具有生化活性的。其他的碱基,转变成RNA链,执行它们自己的功能,例如基因调控。(RNA通常被认作有助于制造蛋白质的起中介作用的信使分子,但ENCODE指出,更多的RNA是一种终端产品,并不用于制造蛋白质。)而许多碱基仅仅落在化学修饰的位置,用作我们染色体的一些沉默片段。
        
        科学家们关于基因的认识,在ENCODE的结果中,是如何不断变化的。该项目发现,约有基因组DNA的76%,被转录成一种或另一种样子的RNA,比研究人员原初预计的更多。人类基因组DNA包括,略少于21000个蛋白质编码基因(一些研究人员曾经估计我们有超过10万个这样的基因);8800个小RNA分子和9600个长非编码RNA分子,这些“基因”中的每一个至少有200个碱基的长度;以及11224个DNA片段被归类为假基因,目前已知这种“不运行”的基因,在某些类型细胞或单个细胞中,事实上是具有活性的。此外,定义这些基因的起始端和编码区的努力,显示了这些基因可以重叠,并有多个起始端和终末端。
        
        该项目在我们的DNA中,发现了400万个位点,作为控制基因活性的开关。这些开关离基因既可以远也可以近,它们在不同类型细胞的不同组合中,调节和发挥作用,给每一类型细胞以*的基因组标识。此外,至少由基因组产生的一些RNA链,也有助于控制由特定基因活动产生的几个蛋白质。因此,基因的调控,不断证明要比曾经预期的复杂得多。
        
        这些和其他的研究结果,今天有6篇论文发表在《自然》,以及有24篇论文发表在《基因组研究和基因组生物学》。另外的2篇论文在线发表于今天的《科学》。在一个数据库中,ENCODE创建了一份图谱,显示出所有不同碱基所起的作用。位于马里兰州贝塞斯达的资助ENCODE的国家人类基因组研究所的一个项目主管,爱丽丝·法因戈尔德(EliseFeingold)说:“对人类基因组来说,这份图谱好像谷歌地图一样。”人们可以在谷歌地图上,选择不同的视图,来观察地球表面某一景观的不同方面。同样,在这份ENCODE图谱中,例如,人们可以放大自染色体水平到单个碱基和开关,来查看那些碱基是否产生RNA,或是在那些地方与DNA调控蛋白相结合。
        
        位于西雅图的华盛顿大学的一个ENCODE研究人员约翰·A.斯泰马图延那泡勒斯(JohnA.Stamatoyannopoulos)说,这份图谱的目录“将改变人们关于对这个人类基因组的思维方式和其实际的应用。”
        
        他和其他的一些人,正在利用这种信息——这种信息中的许多已公开地可以利用——用以了解关于遗传对疾病的影响。许多大型的研究,已发现一些特定的碱基,与自糖尿病到关节炎范围内疾病的较高或较低风险有关联。现在,研究人员可注意观察那些变异,是否涉及某些种类的调控,如果是这样的话,是哪些基因受到了调控。与ENCODE没有关联的加拿大多伦多大学分子生物学家马修·拉品茵(MathieuLupien)说,对他的癌症和表观遗传学的研究而言,“ENCODE的数据是十分重要的。”