人类基因组中,真正有用的成分占了多少?生物学界一直存在两种声音:一派认为大部分DNA都承担着重要职责,另一派认为大部分DNA是“垃圾”。为平息这场争论,科学家们完成了一个大胆的实验——在人类细胞中混入大量植物DNA。结果显示,那些近乎随机乱码的植物DNA,活跃度竟与人类DNA相差无几!新西兰奥克兰大学的布雷特·阿迪认为,这有力地证明,DNA大部分的活跃表现,可能只是无意义的“背景噪音”。这就为“DNA垃圾论”增添了有力证据。
“暗物质”假说对阵“垃圾论”
DNA储存着指挥细胞合成蛋白质的“配方”,但人类DNA中仅有约1.2%用于编码蛋白质,剩下的98.8%在做什么?
从上世纪60年代起,许多生物学家认为,不编码蛋白质的DNA大都是“垃圾”——哪怕确有一小部分非编码DNA非常重要,而且未来我们可能还会不断发现有实际功能的片段,但都不会改变“绝大多数非编码DNA无用”的整体判断。
2011年的一项研究显示,在漫长的进化过程中,只有约5%的人类DNA被保留下来,而对其余的95%,大自然似乎表现出一种“睁一只眼、闭一只眼”的随意态度。换句话说,这些“可有可无”的DNA,难道还会有用?
此外,持“大多DNA无用”观点的生物学家还指出,不同物种的DNA数量差异惊人。例如,洋葱的DNA数量是人类的5倍,肺鱼更是高达人类的30倍。这些DNA也都是有用的吗?
与“大多DNA无用派”不同,“有用论派”生物学家认为,判断人类DNA究竟是否有用,应该看它们有没有在“做事”——只要DNA被转录成了RNA,哪怕某些RNA的功能还不清楚,也说明DNA在“做事”。
基于这个标准,2012年,一个名为“DNA元素百科全书”(ENCODE)的大型研究项目发现,超过80%的人类DNA都在“做事”,都有活性。因而,该项目宣称大部分的DNA绝非“垃圾”。而且,有些学者甚至还用“暗物质DNA”来形容非编码DNA,意思是它们之所以看起来没用,是因为我们还没弄懂其重要性。
把植物基因“塞进”人体细胞
针对ENCODE的结论,美国哈佛大学的肖恩·埃迪在2013年提出了一个大胆设想:启动一个“随机基因组项目”,将包含几百万碱基对的“完全随机合成DNA”植入人类细胞,再用ENCODE的方法检测。某种意义上,这就仿佛是给DNA的蛋白质“配方”塞进大量乱码,然后看它们是会不知所措地沉默,还是会继续保持活跃。
“我们还会看到那些被视为功能证据的活跃现象吗?”埃迪认为,答案是肯定的。
2022年12月5日摄,拟南芥样品。(图源新华社)
由于合成DNA成本高昂,此前的实验最多只使用过约含10万个碱基对的小片段。直到日本研究人员培育出了一种人类-植物杂交细胞,其中包含多达3500万个碱基对的拟南芥DNA,才真正开启了史上最大规模的“随机基因组项目”。
新西兰奥克兰大学的奥斯汀·甘利指出,肖恩·埃迪的“随机基因组构想”,其精妙之处在于,仅凭测量活跃度其实无法论证DNA是否有用,“我们真正需要的是一个基线”。
至少在16亿年前,植物和动物就在进化之路上分道扬镳,此后拟南芥的非编码DNA早就被各种突变“彻底随机化”。埃迪估算,每一个位点恐怕都已经发生过好几次突变,“对人类细胞来说,这些植物DNA确实相当于随机序列”。
“活性”其实只是“背景噪音”
如果按照既有标准,DNA被转录成RNA就标志着其具备功能,那么这段随机而无用的植物DNA,应该几乎检测不到转录活性才对。于是,埃迪和甘利开始测量,每千个碱基对的非编码DNA中,有多少个启动转录的起始点。
实验结果显示,这段拟南芥非编码DNA的起始点密度,竟然达到了人类非编码DNA的80%左右。这有力地表明,ENCODE项目中观测到的所谓“活性”,绝大部分可能只是“背景噪音”。
英国爱丁堡大学的克里斯·庞廷表示:“这些植物序列里发生的生化反应,显然没有赋予人类细胞任何功能。这个活生生的例子,完美展示了生物系统到底有多嘈杂。”
美国休斯顿大学的丹·格劳尔评价说:“这项极具巧思的研究来得正是时候,它再次印证了一个早已显而易见的事实:人类基因组里,大部分都是垃圾。至于‘暗物质DNA’这种说法,纯粹是可笑的胡扯。”
甘利指出,在一个完美设计的系统中,本不该有噪音。但生物进化从不追求完美设计。况且,噪音也并非全无益处,“在不完美的系统中,噪音反而可能催生出一些新奇的事物,进而被自然选择所利用”。
至于人类DNA的活性为何比植物DNA高出约20%,研究团队目前还无法解释。有可能部分多余的RNA确实具有功能,但即便如此,也不会动摇“大部分是垃圾”的结论。目前,研究团队正借助机器学习,试图找出将“可能具有意义的活性”与“纯粹背景噪音”区分开来的方法。