编者按:基因技术可能是人类最伟大又最危险的技术之一,它有可能从根本上改变人类。对于人类具有重要意义的革命将由新基因技术发起,而CRISPR将主导这一革命。YC的作者Geoff Ralston日前撰文,从非技术性角度对CRISPR进行介绍,其中将涵盖关于Gene Drive的探讨。
人类的本质属性可能正在面临着变化,而此次变化的彻底与迅速在人类历史上前所未见。人类历史上旧的一页刚刚翻过,新的篇章已经开始。
对于人类具有重要意义的革命将由新基因技术发起,而CRISPR将主导这一革命。也许在不久的将来,这一概念就能出现在新闻中,人们也能在主流媒体上了解更多信息。CRISPR是Clustered Regularly Interspaced Short Palindromic Repeats(规律成簇间隔短回文重复)的缩写,CRISPR对于基因组学的意义类似于VI(Unix的可视化文本编辑器)对于软件的意义。这是一种编码技术,它将赋予基因工程师前所未有的能力:基因工程师将化身为基因黑客。在CRISPR技术之前,基因工程操作迟缓、昂贵且不准确。现在有了CRISPR,基因编码变得低廉、准确且可重复操作。
本文将从非技术性角度对CRISPR进行介绍,其中将涵盖关于Gene Drive的探讨。Gene Drive是一种生物技术,当与CRISPR相结合使用时将赋予基因工程师更强大的能力。本文所涉及的技术细节非常详尽,对于那些对该技术具有浓厚兴趣的读者,我还提供了大量备注。文末我还将将对这两种技术的意义进行简要概述。
首先,简单介绍一下相关背景信息。存在于DNA中的基因编码信息可以看作是搭建地球上所有生命体的软件。遗传学家的工作就是对基因进行解码,但是受限于有限的编码能力,遗传学的发展一直步履蹒跚。这就像是软件工程师面对来自超强应用程序中的海量数据而无从理解,无法编译。只有具备了对基因软件进行编码和修改的能力,我们的研究才算真正意义上进入正轨。这不仅会让编码工作的发现过程变得更为简单,也有助于对错误代码进行修复改进。——基因黑客应运而生。
想要了解这项神奇的科技,最简单的办法就是追本溯源。DNA本身是由成串的核苷酸组成的。在上世纪八十年代,大阪大学的科学家在对大肠杆菌进行DNA测序时发现了异常。DNA是由长长的数条核苷酸序列组成的,而这个细菌中的DNA出现一段怪异的、杂乱的重复核苷酸序列,而这些序列被它自身数条貌似随机的DNA所打断。随着时间的推移,在其它细菌的DNA中也发现了类似的重复核苷酸序列,人们将这种核苷酸序列命名为CRISPR,因为这个名字能很好地对科学家们所发现的序列进行描述。但是当时没人能解释为什么会有这样的序列,也没人知道它的功能。
在众多能对这些问题加以解释的研究成果中,有两条非常关键:第一,三个不同的团队利用最新的基因材料数据库进行研究指出,细菌中怪异的CRISPR序列和排列错序的病毒DNA高度相似。第二,美国国家生物技术信息中心一位杰出的生物学家Eugene Koonin有了一个关键发现,这是一种可抵抗病毒的生物防御机制。最终,这引领我们发现了CRISPR的作用。
人类一直在与自身的细菌病毒作斗争,而当我们了解到,病毒和细菌在数十亿年间也在进行着殊死搏斗时,我们感觉会感觉到一丝意外。每天都会有上万亿的细菌被病毒杀死(这种能攻击细菌的病毒被称为噬菌体)。得益于数万年进化而来的各种防御措施,细菌努力抵御噬菌体的吞噬。——而这就形成了最基础的免疫系统。而CRISPR就是这套免疫系统里最具有效的武器。
首先,为了避免混淆,让我们先来明确一点。正如我们所见,“CRISPR”本身是一段诡异的DNA序列,但是要将这段序列作为抵御机制,或者如我们下面所提的要实现编码,我们需要一个名为Cas的工具——一种结合了CRISPR的系统。有时候,提到Cas蛋白的具体类型,你会想到Cas9(或者Cas3等等)。因此,这套完整的工具有时也被称为CRISPR/Cas,但是常常简写为CRISPR,本文中亦照此惯例使用CRISPR。
CRISPR的工具原理是:当军火库里存有CRISPR的细菌要抵御病毒的入侵,它们会利用Cas酶抓取病毒DNA的片段,并将这段DNA片段插进自己的DNA。当下次再有这类病毒攻击已经存有该病毒片段DNA的细菌时,细菌就会调用CRISPR序列作为模版识别病毒,并使用Cas酶将其切割成惰性无害片段。
这样的机制非常有效。Cas酶以病毒DNA为模版进行复制,合成RNA分子(RNA和DNA一样,是一种最基本的基因表达形式),形成RNA-Cas复合物。随后该复合物在细菌内随机运动,当遇到另外一个分子时,该复合物会检测该分子是否含有DNA成分,如果有,则检测其序列,如果该序列与复合物中的RNA匹配,那么就说明该分子为病毒DNA,随后RNA脱链,Cas酶继续附着于该分子,发挥作用,像断头台一样分解该病毒DNA使之失活(如果认为病毒有生命的话,也可以称为“使病毒死亡”)。如果你觉得这像是在生物学中实现了免疫学算法,那么你对了:
CRISPR.wander() – until encounter another molecule
If (new molecule contains DNA and DNA matches
CRISPR.dna) CRISPR.cas9.grab() // nab the viral dna
CRISPR.cas9.chop() // kill the virus!
continue
这看起来很酷吧?研究这个过程至少可以让你获得一个博士学位,或者从副教授晋升为教授,但是不会得诺贝尔奖,因为即使这样的发现非常具有人类学意义,但是研究相关课题的队伍很多,每一个团队都有非常突出的见解,竞争非常激烈。他们都明白这套跨越时间长河的抵御系统有可能革命性地颠覆基因工程。如果CRISPR机制可以为我们所用,那么我们就可以精确的切除某段DNA。同时,有了CRISPR和两种Cas9酶,我们可以精确地获得任意想要的片段。当然,这是只编辑的一部分。当你切除了不想要的片段时,你需要向其中替换入你想要的片段。这样的技术非常简单,用我们想要的片段替换剪下的片段,随后细胞中既有的DNA修复酶会重新聚合DNA双链。
CRISPR最酷的一点就是它不像其他现有的基因编辑科技只能在有限的有机体中发挥作用,CRISPR是通用的。理论上,CRISPR可以在任何生命形式的任何细胞中发挥作用。
说了那么多,停一停,我们一起来思考一下CRISPR对人类的未来到底有着怎样的意义。我们将可以在动物世界中摧毁对手。我们将可以治愈基因疾病。我们也许可以发现特制且完美有效的针对病毒或细菌的疗法。我们也许还可以找到治愈癌症的方法。而且(或者我该说“但是”)我们将有能力开发定制我们想要的人类,这都可以做到那么任何生命形式都不在话下。
这就是CRISPR:有史以来最强大的基因工程工具。但是CRISPR一次只能更改一个基因,或者一次只能更改一个有机体。从种族层面的改变来说,CRISPR必须要有Gene Drive这个强大引擎的加持。首先,先介绍一下什么是Gene Drive,再来简单介绍一下那位最有名的程序黑客吧。
Gene Drive这个概念大概是15年前出现的。典型的基因(等位基因)表达是一代又一代通过交配产生子嗣实现的。每一个父代个体只有1/2的DNA会传递给子代个体,因此每一个子代个体只会遗传到每一个父代50%的等位基因(假设只有一个父代个体含有相关等位基因)。如果你有一个蓝眼等位基因,也有一个棕眼等位基因,那么你的子代是蓝眼或棕眼的几率都是50%。由此,在没有任何外力的情况下,子代个体的再下一代是蓝眼或者棕眼的概率就是25%。那么,所谓的外力是什么呢?最明显的就是自然选择。如果某等位基因有益于该个体,那么该等位基因在人群中表达的可能性更大。Gene Drive的作用就是超越自然选择的作用,人为地将某个特定基因遗传下去的概率提高到高于50%的水平。
如果想通过CRISPR影响群体,Gene Drive就非常重要,例如要改造疟蚊使其不再传播疟疾,原有的CRISPR法需要编辑上百万只蚊子的基因才可以从其后代中看到疟疾传播性的减弱(假设这种改变不会赋予被改变的蚊子新的适应能力)。Gene Drive可以一次性地快速在群体中表达某种基因,这比原有的CRISPR法更具优势。MIT的Kevin Esvelt就是在这一步上做了改善。他的想法是开发一种超精准CRISPR编辑力的Gene Drive。朝着这个目标,他开发了有史以来最强大的Gene Drive。
为了弄清楚他的方法,我们先从基因学跳到软件学来看一看吧。1984年,有史以来最伟大的程序员之一、Unix操作系统的发明人Ken Thompson撰文介绍了他最喜欢的黑客案例。他开发一个病毒,可以感染任何一个Unix操作系统的基础组件,这个想法非常了不起。其工作原理如下:
•首先Thompson改写了(使用C语言书写的)Unix“登陆”程序的源代码,给自己留了一个秘密后门,从而可以任意进出的任何Unix系统。
if (password == “user’s password” or password == “ken’s special password”)Log user in.
这样一来,看起来相对粗糙的黑客技术给了他进入任何Unix系统的权限,这些Unix系统都含有他编写的登陆代码。但是其实任何一个人只要仔细检查登录程序,都会发现这部分代码。
•下一步(是真正意义上的黑客技术),Thompson改写了C语言编译程序的源代码,当编译登陆程序时,改变的编译程序可以跨越源代码,在编制输出中植入病毒代码。
改建Unix的核心代码被用来偷偷地搭建了黑客版的Unix。Kevin Esvelt的DNA黑客技术有着异曲同工之妙。
Esvelt发现DNA就是生命体本身的编译程序。生命体的一切,包括CRISPR,都是基于DNA这个编译程序的。所以,就像Thompson所做的一样,Esvelt发现我们可以通过改编编译程序本身来改变其编译结果,而不再需要改编程序内的命令。下面我们简单的介绍一下Esvekt的黑客思路:
•开发CRISPR编辑,通过该技术,在DNA的早期阶段我们就可以编码出想要的序列。比如,将棕眼基因替换为蓝眼基因。
•开发另外一个单独的CRISPR编辑,通过这个CRISPR编辑可以将开发上述第一个CRISPR编辑所需要的命令嵌入同一DNA。也就是说,生命体的编译程序被赋予了识别和改编其他DNA的能力。
•在受精过程中,当改编后的DNA遇到其匹配链时,其内部命令就会就会启动CRISPR工具,该工具随后就会检查新DNA双链,确保新的双链DNA有我们需要的改变。因此,即使母链DNA是未经编码的,只含有棕色眼基因也可以在最后变改变为蓝眼基因。
•最终形成的有机体及其所有子代都包含有相应改变。再见吧,棕眼!
这就是Gene Drive最终的样子。任何基因改变都可以以近乎100%的准确性遗传给后代。物种基因将因此高速传递。
Gene Drive可以运用于各个方面,现在我们已经将其运用于控制和管理各种有机体,从蚊子到细菌都有。但是,我们静下来想一想把这项技术用于人类本身会怎么样呢?有人也许会说改编人类胚胎不符合伦理道德的。政客、宗教领袖以及伦理学家会反对CRISPR及Gene Drive(尤其是可以改变人类的Gene Drive)的使用,并将其列为非法技术。基因相关的疾病可以被完全消除,并且是在婴儿出生前就可以做到。往好处看,随着我们对基因了解地越来越多,我们会运用Gene Drive将某些优势基因编码到子代个体的基因中,子代可以再编码并传给再下一代。可以想象一下这样的优势基因,比如子代所有个体的IQ都增高20-30,可以给社会带来什么。
什么会阻止人类改变自己成为想要的样子呢?接着用上面的例子来说,当科学家都坚信改编基因可以提高IQ会发生什么呢?什么可以阻止政府改编人群的基因呢?什么又会促使政府重新启用这项技术呢?
我们Y Combinator已经投资了CRISPR相关的公司,我预测未来我们会投更多相关领域的公司。我们必须明白一旦基因程序员可以修改生命体的代码,那么一切皆有可能。现在已经有一系列的应用了,不管是已经落地的还是还处在提案阶段的,都异常绝妙。比如,科学家使用CRISPR来改编山羊的基因使其能够在羊奶中产出蜘蛛丝(蜘蛛丝是非常特别的材料,但是很难大批量获取)。又比如,有人提出CRISPR可以用于治愈血友病或代替抗生素的使用。一群中国科学家非常有争议地使用CRISPR改编了(不能发育生长的)人类胚胎。CRISPR编码人类离我们并不遥远。
CRISPR技术越来越完善,越来越准确,越来越可预测,越来越便宜。同时我们对基因编码了解地越来越多(由于这些因素,通过CRISPR技术,我们可以观察到当敲除某个基因并用另外一个基因替补时的结果)。这样的趋势是不可阻挡的,其结果也是不可避免的:在不远的未来我们将可以以任何方式编码任何动物,包括人类本身。我们是否要抵抗这场对于人类有重要意义的革命是一个开放性问题,但是我相信迟早都会有某个人或某个社会站出来成为最早吃螃蟹的人。
编辑:郝鹏程
更多硅谷一线采访,请收听您在硅谷的特派记者徐涛带来的《硅谷早知道》,让您把握趋势发现未来。关注请点击链接( http://36kr.com/goods/10002)
或扫描以下二维码。