探索生命奥秘的里程碑
——写在人类基因组草图发表20周年之际
到今天为止,我们还不能够对一条染色体进行直接测序。人类基因组草图的绘就是一个里程碑,但在探索人类自身奥秘的进程中,这只是一个开始,未来之路并不平坦。
汪强虎 南京医科大学生物信息系主任
编者按 2001年2月15日, 由中、美、日、德、法、英等6国科学家和美国塞莱拉公司联合绘制的人类基因组草图及初步分析结果,在国际期刊《自然》上正式公布。基于人类基因组草图,计算生物学、精准医学、生物技术产业等不断发展,让更多人因此而受益。
在人类基因组草图发表20周年之际,本报推出专版,回顾这一伟大科学工程,并细数我国在这一领域做出的努力、取得的成果。
现在,距离人类基因组草图公布已经过去近20年。2001年2月15日, 中、美、日、德、法、英等6国科学家和美国塞莱拉公司联合发表“人类基因组计划”的结果——人类基因组草图及初步分析,这也是有史以来最准确、最完整的脊椎动物基因组序列。
人类基因组草图的绘就,不仅是人类探索生命奥秘的一个重要里程碑,也成为遗传基因医学和生物技术产业开启的标志。
“人类基因组计划”破译“生命天书”
上世纪50年代以后,随着分子遗传学的发展,人们进一步认识了基因的本质。从此,人类就幻想着有朝一日能解开遗传基因的密码,彻底改变对一些疾病的预防、诊断和治疗的方式,甚至实现对基因的改造重组。
但是,想要破译基因这本蕴藏着生命奥秘、决定人生老病死的“天书”并不容易。人类基因组约含6万到10万个基因,由约30亿个碱基对组成,分布在细胞核的23对染色体中。
“到今天为止我们还不能够对一条染色体进行直接测序。”南京医科大学生物信息系主任汪强虎教授说,“人类基因组计划”实际上就是由复杂到简单,再由简单回归复杂的一个过程。
汪强虎告诉记者,“人类基因组计划”在对人类基因进行测序时采用了两种策略:一是层次测序策略,即先把基因组拆分成大片段并一一克隆,随后再将各个克隆片段分别打碎成小片段,测序后再组装拼接起来,这是6国科学家所采取的策略;二是美国塞莱拉公司提出并采用的全基因组鸟枪法,这种方法绕过大片段连续克隆系统的构建,把基因组直接打散成小片段并随机测序,然后利用计算机算法进行组装。
以今天的眼光来看,2001年公布的人类基因组草图显然还有很多不足,但是它对人类分子生物学的发展起到了巨大推动作用。
在人类基因组测序刚起步的时候,用的是凝胶电泳法,基本上还是手工运作的。20世纪90年代中期,毛细管电泳仪技术的诞生,使得测序的速度大大加快,这种仪器一天就可以测出100万个碱基对的序列。而塞莱拉公司提出的全基因组鸟枪法,则更加简单、高效且成本低廉,发展成为目前通行的测序方法的雏形。
“目前,第三代测序技术纳米孔测序已经诞生。”汪强虎介绍,它靠检测单个DNA分子通过膜上的纳米孔时电流的变化,对DNA进行测序。
“纳米孔测序技术可以获得包含数十万个碱基对的‘超长读取’,这样的长度可以跨越覆盖整个重复区域,从而绕过了一些复杂的挑战。”汪强虎告诉记者,测序技术的长足进步,让那此曾经被认为十分棘手的重复序列检测,变得易如反掌。
测序只是个开始还有“缺口”待补
破译人类遗传密码不仅被认为是达尔文时代以来生物学领域最重大的事件,同时也被认为是人类历史上最重要的科研工程。
按照设想,碱基对测序完毕之后,科学家将分析碱基对如何组成基因以及各种基因有什么功能。弄清全部基因的位置、结构和功能,将为人类征服多种疑难杂症铺平道路。
但是,当人类基因组测序完成10年之后,人们设想的精准医疗并没有如约到来,科学家还在不断为人类基因组序列“打补丁”,同时,参考基因组还需要不定期地更新,这项工作由基因组参考联盟(GRC)负责,2013年,GRC发布了最新的人类参考基因组GRCh38。
去年,美国国立卫生研究院(NIH)宣布,终于获得了人类X染色体的完整的、无间隙的、端对端的序列信息。
汪强虎认为,人类基因组图谱的绘就是一个里程碑,但在探索人类自身奥秘的科学进程中,它仅仅是一个开始,未来之路并不平坦。
对于科研工作者来说,潜在的挑战依然存在。比如,1号染色体和9号染色体的重复DNA片段比X染色体上的要大得多。科学家接下来计划继续努力弥合更多未知的“缺口”区域。
承担1%的任务换来技术飞速进步
值得注意的是,在号称“生命天书”的人类基因序列草图中,1%的工作——3号染色体上的3000万个碱基对的测序工作由中国完成。
汪强虎说,这1%得来并不容易,像德国和法国这样的发达国家也只是承担了约2%—3%的任务,而且中国是唯一一个参与其中的发展中国家。
当年,在被誉为生命科学“研究圣地”的英国桑格基因组研究中心门前曾贴着一张海报,上面写着:“buy one or get one free?”意为即使要花钱,也必须选择参与进来,而不是等待一个免费共享的结果。这句话极大地触动了杨焕明、汪建等科学家。
1997年11月,中国遗传学组青年委员会第一次会议在张家界召开,在这次会议上,杨焕明、汪建等人商量要加入“人类基因组计划”,推动中国基因组科学的发展。在中国科学院和国家南、北方基因组中心同行以及中国科学院遗传所的大力支持下,中国科学院遗传所人类基因组中心1998年8月成立,并于次年6月正式向美国国立卫生研究院提出中国加入“人类基因组计划”的申请。1999年7月8日,“人类基因组计划”网站公布了中国1%申请成功的消息。
杨焕明、汪建等人带领的团队联手向这一生命科学的高峰发起冲刺。中国专家组每天测序量达到200万对碱基,在不到半年的时间里,他们就保质保量并提前完成了任务。这充分体现了中国对人类所负的责任,也体现了我国参与国际科研重大项目的积极态度。汪建曾对媒体表示:“中国虽然只做了1%,但意义重大。中国科研人员在测序过程中,不仅增加了设备,而且培养了技术。”
通过参与“人类基因组计划”,中国科学家得以在短时间内学习并追赶发达国家的先进生物技术,又先后完成了水稻基因组、SARS冠状病毒的基因组研究,以及对熊猫、家猪、家鸡、家蚕等动物基因组的测序工作,使我国的基因组研究得以跻身世界前列。
本报记者 张 晔 【编辑:张楷欣】