作者:袁越
2020-03-04·阅读时长2分钟
本文需付费阅读
文章共计1332个字,产生8条评论
如您已购买,请登录癌症的病根是基因突变,所以抗癌必须从基因入手。人类基因组全序列早在2001年就被测出来了,至今已经过去了将近20年,为什么情况似乎未见根本好转呢?一个原因在于人类基因组太大了,研究起来困难重重。
人类基因组包含30亿个碱基对,如果仅仅将这些“字母”序列(ATCG)储存起来的话,需要占用700M内存,大致相当于一张CD的容量。但真正的全基因组测序结果绝不仅仅只包含这一串数字,还包括对同一个基因片段的重复测量,有时甚至要重复30次以上,这是现代高通量DNA测序的原理所决定的。科学家之间通常以后者的形式交流基因组数据,这样的一个包含所有重复测量结果的数据包大约需要占用200G的内存,大致相当于40张DVD的容量。
目前已经商业化的那些基因检测公司(比如测遗传病和家族史)测量的只是预先选定的若干个突变位点,数据量要小得多。但即使是这样,这些突变位点全加在一起的话也需要占用大约125M的内存。
以上所说的只是数据的储存,如果再加上数据分析的话,所需要的电脑算力将是惊人的,所以基因组分析实验室是云计算服务的热门用户,如果没有云计算,很多DNA分析是根本没有办法进行的。
发表文章535篇 获得6个推荐 粉丝4219人
《三联生活周刊》资深主笔
现在下载APP,注册有红包哦!
三联生活周刊官方APP,你想看的都在这里