荟萃DNA?-

具有文件和元数据的基于DNA的存储系统

查询可能需要几天时间,但可以提取特定的文件。

荧光标记的DNA是新存储系统的关键。
扩大 /荧光标记的DNA是新存储系统的关键。

基于DNA的数据存储似乎为人类不断增长的能力创建的一些问题提供了解决我们想挂断的数据的解决方案。与大多数其他媒体相比,DNA提供了现象数据密度。如果储存在正确的条件下,DNA不需要任何能量以维持几个世纪以来的数据。由于DNA对生物学的中心性,我们总是可能保持阅读它的能力。

但DNA没有没有缺点。现在,没有在DNA链的碱的图案中编码位的标准方法。合成特异性序列仍然昂贵。使用当前方法访问数据速度慢并耗尽用于存储的DNA。尝试太多次访问数据,您必须以某种方式恢复它 - 一个风险引入错误的过程。

来自麻省理工学院(MIT)和布罗德研究所(Broad Institute)的一个团队决定解决其中一些问题。在这个过程中,研究人员创造了一个基于dna的图像存储系统,它介于文件系统和基于元数据的数据库之间。

问题

最近用于在DNA中存储数据的系统(例如一个我们讨论了)涉及在包含数据的DNA片段上添加特定的序列标签。要得到你想要的数据,你只需简单地添加一些DNA片段,这些片段可以与正确的标签进行碱基对,然后用它们来放大整个序列。可以把它想象成给集合中的每一张图片贴上一个ID标签,然后设置一些东西,以便只有一个特定的ID被放大。

这种方法是有效的,但它有两种方式有限。一,放大步骤,完成使用一个名为PCR的过程,对可以放大的序列的大小限制。每个标记都占用了一些有限的空间,因此添加了更多详细的标签(可能需要的复杂文件系统所需的标签)切入数据的空间量。

另一极限是扩增含有特定数据的DNA的PCR反应消耗一些原始DNA文库。换句话说,每次拔出一些数据时,都会销毁堆的无关数据。通常足够访问数据,您将最终通过整个存储库刻录。虽然有方法来重新放大所有内容,但每次完成这一切时,它都会增加引入错误的可能性。

这项新研究将标签信息从数据存储中分离出来。此外,研究人员还创建了一个系统,可以只访问你感兴趣的DNA数据,而不触及其他数据,从而延长数据存储的寿命。

壳牌游戏

这项基本技术是基于DNA会附着在二氧化硅玻璃珠上这一事实。这种吸引力与DNA的大小无关,所以你可以使用这个系统存储任意大的数据块(在这种情况下,片段的大小超过过去使用的典型DNA数据块的10倍)。同样重要的是,数据中没有存储DNA中的标签,因此数据存储和文件系统信息之间没有竞争。

一旦DNA在这些珠子的表面上,研究人员就在其顶部聚合了一些额外的二氧化硅。该过程涂覆DNA并保护其免受环境。使用荧光标签,研究人员证实系统有效;本质上,所有颗粒都含有DNA。

只有当这个外壳就位后,研究人员才添加标签,这些标签与外壳有化学联系。这些标签是由单链DNA构成的,并且有可能在一个单一的玻璃外壳上附着几个不同的标签。

研究人员对每个数据块分开处理过程,一旦一切都到位,标记的玻璃球可以混合到单个数据库中。虽然不如纯DNA的储存那么紧凑,但图书馆仍然具有稳定的优点,并且不需要能量进行维护。

找到文件

但有趣的部分正在访问数据。研究人员在DNA中存储了关键词相关的图像集合,在连接到玻璃壳的外部的DNA中编码的每个关键字。要使用他们的例子,橙色宠物猫的图像将与关键字“橙色”,“猫”和“国内”相关联,而老虎的图像只会有“橙色”和“猫”。

因为这些标签是单股的,所以可以设计与其形成双螺旋的匹配序列。标签与不同颜色的荧光分子相关联,使得与右侧标签连接的任何玻璃壳都将开始发光的特殊颜色。我们已经有机器使用激光器根据它们发光的颜色(通常,机器用于对荧光标记的细胞进行分类)来分离事物。在这台机器中,橙色的猫珠将在不同的波长下焕发,而不是橙色猫珠,所以房子猫可以被拉出图书馆。

图书馆的其余部分将保持不受影响,因此每次发生此过程时都没有显着的数据丢失。因为珠子比水更密集,所以通过使用离心机将图书馆的未使用部分旋转到试管的底部,可以轻松地重新集中数据存储器。

研究人员使用玻璃蚀刻溶液释放DNA,然后将其插入细菌中。用于存储的DNA被设置为允许细菌复制许多副本来读取数据。

DNA数据库 - 不,不是那种

有趣的是,系统允许布尔搜索多个术语。通过一个接一个地选择或反对不同的标签,您可以建立相当复杂的条件:真正的猫,驯化的假,为黑色,如此。标记具有相同荧光颜色的两个标签将为您提供相当于逻辑的,或者如果您以这种颜色抓住任何颜色。

因为这些标签中的每一个可以被视为关于由DNA存储的图像的一段元数据,所以珠子的集合最终充当元数据驱动的图像数据库。

虽然该研究代表了基于DNA的储存的复杂性的显着飞跃,但它仍然只是基于DNA的储存。这意味着它的速度很慢,使磁带驱动器似乎很快。研究人员计算出即使它们在每个玻璃珠中挤压了更多的数据,也会在每秒左右的数据中开始突出。这意味着搜索数据的矮子性会在两周内需要一点。

这只是找到右玻璃珠。将它们打开并将DNA变成细菌,然后进行实际确定存储在珠子中的内容所需的序列可能会增加几天的过程。

但当然,没有人暗示我们使用DNA存储,因为它很快;正如我们上面提到的那样,其有用的属性在能源使用和数据稳定性中。如果我们相信我们不想经常访问它,我们只能在DNA中存放一些东西。鉴于这一点,任何做出更多功能和灵活的方法都可能有价值。

自然材料,2021年。DOI:10.1038 / s41563-021-01021-3对必须).

42岁的读者评论

  1. *意外点击defrag *

    天啊,我都做了什么?!?!

    扰流板: 表演
    图像
    5432帖子|挂号的
  2. 所以我什么时候在手腕上拿到Cyber​​punk USB线?
    26帖子|挂号的
  3. “只有当我们确信自己不希望经常获取某些信息时,我们才会将其存储在DNA中。”

    好吧,我们实际上在那里储存了很多东西,我们一直在进行访问!
    554帖子|挂号的
  4. 嗯......一旦我的文件和我的妻子的文件在存储媒体中混淆了,会发生什么?更不用说,防病毒看起来像什么?
    1862年帖子|挂号的
  5. 如果我的DNA编码的SQL数据库逃脱储存并将其作为质粒整合到细菌中,从超出星星的恒星恐怖,呈现出所有永恒的阳光之光?
    429帖子|挂号的
  6. 嗯......我真的没有看到它的用例,除了是一个酷的技术演示。也许如果它将数据存储为区块链并以某种方式使用AI算法,它可以吸引公平的VC金钱。
    259帖子|挂号的
  7. 尽管我喜欢他的工作,一个基于DouglasNoëlAdams(1952-2001)的存储系统听起来本身危险。

    *阅读文章*

    哦,这其他脱氧核糖核酸。
    2555帖子|挂号的
  8. “查询可能需要几天”

    我是一个铁路开发商:我希望我能从我的询问中获得那种表现。
    24帖子|挂号的
  9. 图像

    这让我想起了追逐,我最喜欢的Stng故事之一。但实际上,如果我们在我们的DNA中找到一条消息,那么它可能会说,“我们一直试图与您联系有关您的汽车保修......”
    762帖子|挂号的
  10. 生病了,旅行者比我们想象的更多科学和更少的小说。
    456帖子|挂号的
  11. 呵呵,这不是我认为蠕虫驱动器的所有。
    2932个帖子|注册
  12. 瓦拉迪亚写道:
    如果我的DNA编码的SQL数据库逃脱储存并将其作为质粒整合到细菌中,从超出星星的恒星恐怖,呈现出所有永恒的阳光之光?


    谁说,这已经没有发生在其他地方?
    4566帖子|挂号的
  13. 瓦拉迪亚写道:
    如果我的DNA编码的SQL数据库逃脱储存并将其作为质粒整合到细菌中,从超出星星的恒星恐怖,呈现出所有永恒的阳光之光?


    我很确定Bobby Tables是几年前诞生的,从那以后他就破坏了许多学校系统和他们未经处理的数据库输入
    5432帖子|挂号的
  14. 嗯......我真的没有看到它的用例,除了是一个酷的技术演示。也许如果它将数据存储为区块链并以某种方式使用AI算法,它可以吸引公平的VC金钱。


    它给出了原因,这是一个比区块链更多的引人注目和有用的想法,这可能是一个通过的人。稳定,耐用的长期数据存储,以非专有格式是一种圣杯,为政府,行业,教育和研究......如果它可以自我修复和正确的错误,就像我们自己的DNA是,它可能永远持续了。
    762帖子|挂号的
  15. 这个用例让我想到磁带备份。一旦磁带被归档,如果我们需要恢复某些东西,那么从归档位置取回磁带可能需要几天的时间,而从磁带本身取回数据则需要花费多少时间。
    187个帖子|挂号的
  16. ...就像那些可以恢复你的文件的IBM磁带机器人之一,但您可能会发现它更快地重新创建它们......
    |注册了143个帖子
  17. 因此,地球上的生命开始作为一个被放错文件的外星硬盘的片段?
    15768帖子|挂号的
  18. 嗯......一旦我的文件和我的妻子的文件在存储媒体中混淆了,会发生什么?更不用说,防病毒看起来像什么?


    听起来我们需要谈论数据库来自哪里。
    245帖子|挂号的
  19. 仙人掌写道:
    嗯......一旦我的文件和我的妻子的文件在存储媒体中混淆了,会发生什么?更不用说,防病毒看起来像什么?


    听起来我们需要谈论数据库来自哪里。


    当CSV和XML相互输入时......

    尽管它是一个后门,你会得到一个新的父目录
    5432帖子|挂号的
  20. 这一切都很好,但我会等到我们可以获得一个DNA RAID阵列,我的脾脏充当备份。
    351帖子|挂号的
  21. 嗯......一旦我的文件和我的妻子的文件在存储媒体中混淆了,会发生什么?更不用说,防病毒看起来像什么?



    恐怕DNA的情况要复杂得多。你不仅需要反病毒,还需要反核酸酶来避免DNA被分解。

    总结DNA,它的自我需要没有核酸酶,因为核酸酶分解/破坏DNA,并且在细胞中,你会分解为DNA。通常,在净化/清洁期间,通过各个步骤进行拆卸,然后确保没有核酸酶进入您正在进行测序和其他工作的房间/地区,但我确信如果他们这样做有其他方法可以打破它们把它变成它。

    您插入DNA的细菌通常也通过避免在您的细胞中捕获病毒来开始,但是如果您不得不尝试一些抗病毒药物,例如Remdesivir。我不知道这些药物是否实际上在细菌中工作。通常,如果他们确实受到污染,你只是重做它,同时更加小心。

    在一般生物学中,污染了很多污染。通过突出的生物化,看看Covid疫苗生产,这些疫苗产生了具有重要问题的生物化。用火和/或烧毁实验室的杀死它是许多沮丧的科学家的推荐解决方案。

    https://en.wikipedia.org/wiki/nuclease.
    https://agscientific.com/nuclease-away.html
    https://en.wikipedia.org/wiki/bacteriophage.
    https://en.wikipedia.org/wiki/remdesivir.
    https://www.nytimes.com/2021/04/06/us/c…tions.html
    |注册了116个帖子
  22. monogon写道:
    这让我想起了追逐,我最喜欢的Stng故事之一。但实际上,如果我们在我们的DNA中找到一条消息,那么它可能会说,“我们一直试图与您联系有关您的汽车保修......”


    *愤怒的克林贡遗传学家向一个古代类人全息图发射破坏者*

    “由Kahless的胡子,我不认为你为我提供免费巡航!”
    254帖子|挂号的
  23. 哎呀!你奶奶的照片变了。很抱歉。
    11397帖子|挂号的
  24. monogon写道:
    嗯......我真的没有看到它的用例,除了是一个酷的技术演示。也许如果它将数据存储为区块链并以某种方式使用AI算法,它可以吸引公平的VC金钱。


    它给出了原因,这是一个比区块链更多的引人注目和有用的想法,这可能是一个通过的人。稳定,耐用的长期数据存储,以非专有格式是一种圣杯,为政府,行业,教育和研究......如果它可以自我修复和正确的错误,就像我们自己的DNA是,它可能永远持续了。


    棘手的比特是,你试图利用生物津贴的那一刻,你让自己开放到进化压力。

    基因组有一些令人印象深刻的高度保守的序列;但它们通过非常适合选择性压力(通常为某些东西的危重或擅长复制而真正擅长)来实现这种方式;不是它是一大堆在生物学上毫无用处的东西,只是用来编码我们想要存储的任何数据。

    如果你只是想要一个相当稳定和易于控制的分子DNA并不是最糟糕的选择;但却很少兴奋的一旦你最终必须处理一个still-fussy一些有机化学(而不是laser-formed微观结构在熔融石英或一些类似的化学和物理稳定的无机材料,你可以光读出不试剂在你的手);或者试图利用生物学的倾向为你复制DNA;和必须处理大多数要存储的数据只是重量让你使用的是哪种生物不如如果只是甩了你的无谓(与随之而来的风险,他们将这样做在很多代。
    7482帖子|挂号的
  25. Cugamer.写道:
    “查询可能需要几天”

    我是一个铁路开发商:我希望我能从我的询问中获得那种表现。


    当您在L2网状物中预存所有热查询和可执行文件时,它会更快地运行一点。orm有很多开销。
    |注册了352个帖子
  26. 嗯......我真的没有看到它的用例,除了是一个酷的技术演示。也许如果它将数据存储为区块链并以某种方式使用AI算法,它可以吸引公平的VC金钱。


    通过使用垃圾术中的外交通信加密。“剃掉了Messenger的头发和纹身纹身纹身”方法的新扭曲。
    |注册了352个帖子
  27. 碉堡了!Digital Devil Saga是对的!让我们希望太阳不会变成黑色,人们被迫成为怪物,所以他们不会变成石头.....
    287帖子|挂号的
  28. “查询可能需要几天”
    为什么天?
    可能是…中等大小的DNA串…对吧?
    125帖子|挂号的
  29. 更不用说,防病毒看起来像什么?


    信使rna吗?
    88个帖子|注册
  30. 瓦拉迪亚写道:
    如果我的DNA编码的SQL数据库逃脱储存并将其作为质粒整合到细菌中,从超出星星的恒星恐怖,呈现出所有永恒的阳光之光?


    最终结果与不发生的终极结果相同。所有路径都导致相同的终端状态。
    7342帖子|挂号的
  31. 我们创造的数据远比我们能读到的要多得多。
    778帖子|挂号的
  32. monogon写道:
    嗯......我真的没有看到它的用例,除了是一个酷的技术演示。也许如果它将数据存储为区块链并以某种方式使用AI算法,它可以吸引公平的VC金钱。


    它给出了原因,这是一个比区块链更多的引人注目和有用的想法,这可能是一个通过的人。稳定,耐用的长期数据存储,以非专有格式是一种圣杯,为政府,行业,教育和研究......如果它可以自我修复和正确的错误,就像我们自己的DNA是,它可能永远持续了。


    你让它听起来不错,但安全?不,SHA256击败了DNA安全(通过什么?RNA /蛋白,您每年不断地设计对新病毒的反应?)。如果在不需要完美诚信的媒体中存储以孤立的时尚(真的,那个)的媒体储存,我不介意DNA作为档案媒体的想法。但与Sha256加密区块链进行比较?不 - 没有意义。

    我的意思是,两者都可以使用。但不需要与区间划分。完全不同的目的。安全数据永远vs只有磁盘上的文本文件。
    46个帖子|挂号的
  33. 当我看到一个时,我知道一个吉布森。
    |注册了12个帖子
  34. TOOM1275写道:
    哎呀!你奶奶的照片变了。很抱歉。

    我的奶奶!你的牙齿好大啊!
    18个帖子|注册
  35. 瓦拉迪亚写道:
    如果我的DNA编码的SQL数据库逃脱储存并将其作为质粒整合到细菌中,从超出星星的恒星恐怖,呈现出所有永恒的阳光之光?

    我完全普通的数据库已经多次完成了我的笔记本电脑。如果它变得众生和乘以,我讨厌看到恐怖会随之而来的恐怖。
    3114帖子|挂号的
  36. 我可以使用这种概念证明来预见科学文盲,以断言[基本医疗过程]仅仅是将数据存储在DNA中作为野兽的标记等等。

    为什么我总是在想这样的人在接触到新技术,尤其是生物学后会做些什么?它是累人的。
    571帖子|挂号的
  37. 他们只需要添加一些索引来避免全表扫描。
    5665帖子|挂号的
  38. 这似乎是局部的。。。

    扰流板: 表演
    图像
    5665帖子|挂号的
  39. 很酷的是,人们正在研究这个&可能会有一个非常有用的利基市场。但是很多所谓的寿命似乎依赖于持续的维护和重写数据。

    很难想象在薄的玻璃或水晶上敲打蚀刻的小块来延长寿命。我也很难想象我们在为谁存储什么数据密度的解决方案不只是一个更大的盒子。

    但话说回来,我一直不明白为什么当我们今天仍在燃烧煤炭和挖掘碳时,人们却担心在未来一万年标记核废料。

    我有一种预感,将数据存储千年的解决方案并不是真正的技术,而是将其附加到有用的东西上。当然,假设有一些数据值得为将来存储,但也没有足够的用处供人们维护
    |注册了116个帖子

你必须评论。

渠道ARS Technica