这是一个网上文化杂志



解码生命:人类基因组的测序

作家: 阿兹拉.拉扎博士 - 发表于: 2012年8月15日 | ENG (English)

人类大部分非传染性疾病都可以归结到先天遗传或细胞的后天缺陷。癌症就是其中一个明显例子,外界病菌感染与细胞先天留损易感性结合会导致细胞关闭控制死亡讯号的基因,使细胞不会正常死亡并不断繁殖,直到患体死亡为止。因此,如果我们能搞清楚一个正常细胞恶化成癌细胞的基因变异过程,要找出癌症的治疗方法也就简单多了。这些信息都隐藏在部分基因上,由于所需人力和物力巨大,精确定义人类细胞中单个基因的序列至今都是一个梦想。本世纪初发生的一件事见证了一切的改变,在了解每个癌症病患的基因信息后,癌症研究人员包括我自己首次开始有信心在短期内将这种恶性疾病转化为可以长期存活而不致死的慢性疾病。

美国推出了两幅引人注目的图。第一幅地图是两个世纪前路易斯和克拉克从东海岸出发一次远征的成果,将边境线一直绘制延伸到太平洋,它永远激发着美国人的想象力。第二幅图更令人惊叹,2000年该图的公布影响了整个人类,它首度研究了人体所有基因组并揭开了生命之书的篇章。

单个细胞发挥功能主要依赖蛋白质。比如,血红蛋白是由一种叫球蛋白的蛋白质附到铁(血红素)上形成的。合成球蛋白的信息包含在两条DNA上,这两条DNA由四种碱基 (腺嘌呤A、胸腺嘧啶T、鸟嘌呤核苷G和胞嘧啶C) 重复排列构成 (A通常与T配对,G通常与C配对)。 DNA分子链螺旋式交织缠绕在一起形成细胞核中的染色体。基因就是包含合成特定蛋白质信息(如球蛋白)的DNA片段。总体而言,单个细胞中的所有的基因被称为基因组,精确描绘核苷酸的特定序列就是我们所说的人类基因组测序。

1988年,美国国家卫生研究所(NIH)召集了一个科学小组描绘人类DNA中的所有基因和确定构成人类DNA碱基对序列,并将这些信息存入公共数据库。政府为该项目划拨了30亿美元,预计用时15年。1990年初正式开始启动,不过,测序工作需要的技术需要耗费大量人力和时间。1991年,国家卫生研究所一位杰出的科学家克雷格.温特博士建议与其测序人体所有基因组,不如蛋白质合成的基因会更容易,因为基因只占DNA的2%。即便是在一个基因里, 把被称为“内含子”的长段被拿掉,将剩下被称为“外显子”的部分拼接在一起形成一个缩减版的基因,这实际上是蛋白质合成的编码。文特尔建议只有外显子应该被测序。他的建议没有受到重视,所以他辞掉了美国国立卫生研究院的工作,开始用私人赞助研究人类基因组测序项目。政府和私人赞助项目之间的竞赛对于测序技术更快更好的发展、乃至对项目支柱计算分析的改进起到了巨大的推动作用。

第一个问题是决定测谁的基因组序列。最终决定检测从一个多样化志愿者小组中抽取的DNA,他们的身份都被保密。基因组每个部分的测序是即刻公诸于世的——事实上,关于基因组新数据24小时都在更新。政府和私人两方的结果由总统克林顿2000年6月26日在白宫东厅举行的会议上联合发布。这儿给出了一些让人震惊的发现:
人类基因组包含30亿个化学核苷酸碱基(A、C、T和G)
普通基因由3000个碱基构成
基因总数是30000,而非原来预想的100000
所有人身上的核苷酸碱基几乎(99.9%)完全相同(种族主义者可以闭嘴了!)1号染色基因最多(2968),Y染色体基因最少(231)

预期好处
提高我们精确诊断引发疾病的基因缺陷的能力。
识别个体基因预设潜在的病症,并找出方法防治。
使用基因治疗
开发适应个性化需求的“定制药物”

2010年,克雷格•文特尔达到另一个里程碑, 他在实验室里创造了一个“合成细菌” (这也使他被国内右翼原教旨主义者冠上玩弄上帝的恶魔之名)。资本主义体系的一个好处就是带来了激烈的竞争和技术进步的加速发展。1990年的人类基因组计划构想花费30亿美元在15年内完成它,但利用温特的“集中测序外显子”建议使得项目不到三年就完工了,与原先的3亿美元相比,温特完成人类基因组测序工程仅花掉政府3000万美元。到2013年,我们期待拿着一个移动U盘般的小盒子,插上一台电脑就能现场测序基因组,只要1000美元和不到一个小时就能搞定。

下面是温特想要说的话:“有人对我说,人类基因组的测序将剥去生活的神秘,减少人性。诗人认为,基因组测序是分解还原论的老一套,没有什么比这更不靠谱了。但构成我们遗传编码的无生命的化学物质对人类精神产生了无法估量的影响,它的复杂性和神秘性启发了诗人和哲学家启发了几千年。”有趣的是,温特博士将“水印”(部分不起作用的基因代码)加到新微生物上,创造出的新合成细菌是没有编码序列的。詹姆斯.乔伊斯说过一句:“活着,犯错,失败,成功,生命之外再造生命。”