《科学大家》|人工生命离我们有多远?进展比AI还快?

《科学大家》|人工生命离我们有多远?进展比AI还快?
2018年01月15日 09:05 新浪科技

  出品 | 新浪科技《科学大家》

  撰文 | 林章凛博士 长江学者特聘教授、973首席科学家、华南理工大学生物科学与工程学院院长

       专题讨论:合成生命之争:比人工智能进展还快?

  2016年以来,以AlphaGo为标志的人工智能技术进入了发展的快车道,成为了民众热议的话题。2017年12月27日,华大基因董事长汪建在深商大会上表示,未来的5-10年,我们可以化学合成任何生命,人工生命(合成生命)的进展可能比人工智能还快。此言一出,立刻引起了巨大的反响。

  合成酵母的科学杂志当期封面

  汪建先生的话,源于2017年3月15日天津大学、清华大学和华大基因的科学家同时在科技界顶级杂志《科学》(Science)发表的四篇文章,这四篇文章分别描述了如何用化学的方法合成酵母基因组的4条染色体。这是构建人工生命的一个非常重要的进展。这项工作,入选了我国十大科技新闻和生命科学十大进展。

  那,人工生命,到底离我们有多远?这里我们先回顾一下相关科学历史和进展,再来回答这个问题。

  DNA与染色体

  1、基因组和染色体都是什么?

  地球上的不同生命或者不同物种,都是由其细胞内的遗传物质,即脱氧核糖核酸分子(DNA)决定的。DNA分子很特别,是一种双链的结构,含两条由四种不同核苷酸单体串起来的单链,以反向的双螺旋互相纠缠延伸。这四种核苷酸单体结构很相似,分为三个部分,其中二个部分的结构都是相同的,只有一个部分的结构不同,这部分结构叫“碱基”,根据碱基的不同,四种核苷酸单体分别叫 A、T、G、C。非常奇妙的是,A与T、G与C可以通过其碱基配对。DNA分子就是通过这些单体的配对而形成双链。一条单链上某个位置如果是单体A,对应的另外一条单链上必然是单体T。DNA双链分子结构,是1953年由美国科学家詹姆斯·沃森(James Watson)与英国科学家弗兰西斯·克里克(Francis Crick)发现的。他们后来得到了1962年诺贝尔生理或医学奖。

  四种A、T、G、C单体的不同排列组合,就构成了每种生命的密码本。DNA双链分子上有不同的区域,有的代表基因,有的和基因调控相关,但是也有一些区域(比如细菌的DNA)甚至很多区域(比如人的DNA),我们其实还不知道有什么作用。奇怪吗?不奇怪。科学上还有太多太多未知。因为DNA双链分子上分布着基因,所以科学上通常又把一个物种的DNA统称为“基因组”。不同物种的基因组大小不同,通常以“百万碱基对”为单位。严格意义上,其实这是“百万核苷酸单体对”。但是生物学很特别,跟其他理工科不同,存在很多说法上的约定俗成,行外人可能哭笑不得,行内人倒习以为常。这里按下不表。

  生命有两个大类,原核生物和真核生物。人们常听说的大肠杆菌,属于“原核生物”,其基因组是一条DNA双链分子,含4.3百万碱基对。酿造啤酒常用的酵母,属于“真核生物”,其基因组含12.2百万碱基对。有趣的是,像酵母这种相对复杂的微生物以及更高级的物种,其基因组的组织形式就开始不同了。酵母的基因组有16对长短不一的DNA双链分子(即32条DNA双链分子)。因为这些DNA双链分子在空间上是高度但有规律地折叠在一起的,显微镜下可以染色观察,所以科学上把它们又称为“染色体”。或者说,酵母的基因组有16对染色体。那人的基因组是什么情况?我们基因组一共有3,300百万碱基对(33亿碱基对),分布在23对染色体上。通俗地说,染色体就像把一个长串的珍珠有规则地放入一个长形的首饰盒。否则,人类的基因组,拉成一条线的话,将近2米,显然一个正常的人体细胞是无法容纳的。

  2、我们什么时候破译了各种生命的基因组序列或者密码本?

  1970年代之前,我们其实不知道任何基因组的具体ATGC序列。其后,美国科学家沃特·吉尔伯特(Walter Gilbert) 和英国科学家弗雷德里克·桑格(Frederick Sanger)发明了DNA测序方法,并因此获得了1980年诺贝尔化学奖。特别值得一提的是,祖籍福州的美籍华人、美国康内尔大学吴瑞教授,对此方法做出了重要贡献。但是当时这项方法的效率和速度都比较低,只能用来测DNA片段、某个基因或者一些特别小的基因组。1977年,第一个完整的基因组,一种叫phi X 174的细菌病毒测序完成,只有5,386个碱基。为何这里的单位是“碱基”而不是前文的“碱基对”呢?因为这个病毒和很多病毒一样,比较特殊,其基因组是单链的DNA。严格意义上,病毒也不是完整的生命,只能算是生命的“寄生虫”。

  进入1980年代,测序方法的不断改进和自动化,使得基因组测序工作得于迅速推进。1995美国科学家克雷格·文特尔(Craig Venter)领导的小组发布了第一个完整的能够独立生存的生命、流感嗜血杆菌的基因组序列,共 1,830,137 碱基对(或1.8百万碱基对),估计有1500个基因。流感嗜血杆菌是一种细菌,属于原核生物。1996年,科学家公布了第一个真核生物、酵母的基因组序列,大约有6千多个基因。上文提到的大肠杆菌,其基因组测序是1997年完成的,大约有4千多个基因。那大家肯定会想到,人类的基因组呢?人类基因组测序计划是在1990年启动的,2000年第一份草图完成,2004年正式完成,经历了15年,一共发现大约有2万多个的基因。如果我们把人类基因组的序列印刷成书的话,大约要262,000页,或者175本厚书。其它与人比较相近的哺乳动物基因组测序也先后相续完成。有意思的是,人们发现大猩猩的基因组与人基因组96%相似。

  3、有基因组测序,就必有基因组合成,必有人工生命

  人类很早就知道通过化学的方法合成短片段的DNA。通过这些短片段DNA的组装,科学家们开始探索化学合成基因组。很自然地,第一个合成的就是病毒基因组。2003年,同样是美国科学家文特尔小组,利用化学方法合成了上文提到的phi X 174的细菌病毒基因组。2005年,科学家们重新设计合成了另外一个叫T7的细菌病毒基因组。2008年,文特尔小组化学合成了一种叫生殖道支原体(Mycoplasma genitalium)的细菌基因组,长度约0.58百万碱基对,但是此时他们还没能把这个合成基因组移植到受体细胞中并证明其有生命的功能。2010年,这个小组人工合成了相近的丝状支原体(Mycoplasma mycoides)基因组,共1.08 百万碱基对,并移植到受体细胞中。一段时间后,该移植细胞完全由合成基因组控制。就这样,他们创造了人类历史上第一个真正意义的人工生命。当然,罗马不是一天建成的。文特尔小组是用了10多年的时间,才走到这一步的。根据时间推算,这项工作大约起始于本世纪初,即人类基因组测序的草图完成之时。

  第一个人工生命 “辛西娅”

  文特尔小组将这个人工生命命名为”辛西娅”(synthia)。这个人工合基因组,绝对大部分序列与该丝状支原体天然的基因组是一致的。但是该小组也加入了一些原先不存在的DNA序列(他们称之为“水印”)。其中蕴含了一些名言,比如“去生活、去犯错、去跌倒,去胜利、去从生命中重造生命”、“我无法建造的东西,我也不能理解”。后者出自加州理工学院的物理学家理查德·费曼(Richard Feynman)。

  此后,人们又相继合成了其它细菌的人工生命。很自然,科学家们的下一个目标会是真核生物,显然,酵母是最好的选择。这项工作始于2005年,并逐步形成了一个中国科学家参与在内的国际“合成酵母计划”。科学家们首先选择了第3号染色体,这项工作主要由美国科学家杰夫·伯德(Jeff Bode)小组完成。天然的3号染色体原有316,667碱基对,他们对此进行了小心但是大量的工程设计或者说“重新编写”,最终人工的3号染色体含有272,871碱基对,比天然的少了13.8%。该染色体被导入酵母细胞,取代了原来的3号染色体,得到了第一个人工的酵母细胞。这项工作发表在2014年的《科学》杂志上。

  这次我国科学家发表的4篇文章,分别涉及4条染色体。天津大学的元英进小组完成了5号和10号合成染色体,长度分别为536,024 和707,459碱基对;清华大学的戴俊彪小组完成了最长的12号合成染色体,长度为976,067碱基对;华大基因研究院的杨焕明小组联合英国爱丁堡大学完成了2号合成染色体,长度为770,035碱基对。中国科学家合成的染色体比2014年发表的3号染色体在长度上有显著的难度,并开发了一些关键技术,如染色体缺陷靶点定位技术。天津大学团队还合成了环形的5号染色体,为相关染色体疾病提供了重要的研究模型。

  4、人工生命与合成人

  现在回到我们的题目:“人工生命离我们多远?”,答案其实是人工生命早就在我们的身边。这些合成生命,比如合成酵母,有重要的科学和经济价值。比如,合成酵母有助于人类更深刻地理解一些基础的生物学的问题;另一方面合成酵母有很多巧妙的工程设计,可以实现定向的人工进化,在医药、能源、环境、农业、工业等领域有非常重要的应用潜力。

  现在问题是,下一步会不会是合成人的基因组、合成人?这个工作其实已经开始。2016年,国际上相关科学家已经开会讨论启动这个项目,有些观点已经发表在当年的《科学》杂志上。目前,一些基础性技术性工作已经在不同的国家不同的实验室开展。当然,从合成酵母的基因组到合成人的基因组,存在巨大的技术屏障。首先是规模上的难度,人的基因组是酵母的270多倍;其次是技术上的难度,比如染色体移植在酵母中比较容易实现,但是对于人体细胞,就非常困难。这些技术屏障,是否能够在5-10年得到解决,我们拭目以待。

  有人担忧这项工作所带来的伦理、道德和生物恐怖主义问题。但我们有句话叫“魔高一尺、道高一丈”。从科学史看,人类总是有足够的智慧控制科技发展带来的风险。事实上,1990年开始的人类基因组计划,开始也是争议极大。但是现在回头看,这个计划革命性地推进了人类对生命的理解、推进了医学和相关生物技术的进步。我们有信心,人类基因组合成,将有类似的重大意义。当然,人类要有足够的风险意识。

  人工生命(合成基因组)是合成生物学一个非常重要的分支。合成生物学被视为继“DNA结构发现”和“人类基因组计划”之后的第三次生物技术革命,它对人类的生活、医疗、经济和军事,将产生渐进性的、渗透性的、但颠覆性的重大作用。

  《科学大家》专栏投稿邮箱:sciencetougao@sina.com  来稿请注明姓名、单位、职务

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

苹果汇

众测

来电聊

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片