Будущее хранения данных - за микрокапсулами ДНК

  • Пользователь Алексей Коровин опубликовал
  • 5 мая 2023 г., 17:18:15 MSK
  • 0 комментариев
  • 44 просмотра
Хранение данных в ДНК звучит как научная фантастика, но это относится к недалекому будущему. Эксперты ожидают, что первый центр обработки данных ДНК будет запущен в эксплуатацию в течение пяти-десяти лет. Данные будут храниться не в виде нулей и единиц на жестком диске, а в парах оснований, составляющих ДНК: AT и CG. Такой центр обработки данных имел бы форму лаборатории, во много раз меньшей, чем те, что существуют сегодня.

Хранение данных в ДНК звучит как научная фантастика, но это относится к недалекому будущему. Профессор Том де Гриф ожидает, что первый центр обработки данных ДНК будет запущен в эксплуатацию в течение пяти-десяти лет. Данные будут храниться не в виде нулей и единиц на жестком диске, а в парах оснований, составляющих ДНК: AT и CG. Такой центр обработки данных имел бы форму лаборатории, во много раз меньшей, чем те, что существуют сегодня. Де Гриф уже может представить себе все это. В одной части здания новые файлы будут кодироваться с помощью синтеза ДНК. Другая часть будет содержать большие поля капсул, каждая капсула будет упакована в файл. Роботизированная рука извлекет капсулу, прочтет ее содержимое и положит обратно.

Мы говорим о синтетической ДНК. В лаборатории основания склеиваются в определенном порядке, образуя синтетически полученные нити ДНК. Файлы и фотографии, которые в настоящее время хранятся в центрах обработки данных, затем могут быть сохранены в DNA. На данный момент техника пригодна только для архивного хранения. Это связано с тем, что считывание сохраненных данных обходится очень дорого, поэтому вы хотите как можно реже обращаться к файлам ДНК.

Большие, потребляющие энергию центры обработки данных устарели

Хранение данных в ДНК обладает многими преимуществами. Например, файл ДНК может храниться гораздо компактнее, а срок службы данных также во много раз больше. Но, возможно, самое главное, что эта новая технология делает устаревшими большие, потребляющие много энергии центры обработки данных. И это крайне необходимо, предупреждает Де Гриф, "потому что через три года мы будем генерировать столько данных по всему миру, что не сможем хранить и половину из них".

Совместно с аспирантом Басом Бегельсом, Microsoft и группой университетских партнеров Де Греф разработал новую технологию, позволяющую сделать инновационное хранилище данных с использованием синтетической ДНК масштабируемым. Результаты были опубликованы сегодня в журнале Природные нанотехнологии Де Гриф работает на кафедре биомедицинской инженерии и в Институте сложных молекулярных систем (ICMS) в Эйндховенском университете и является приглашенным профессором в Университете Радбуда.

Масштабируемый

Идея использования нитей ДНК для хранения данных возникла в 1980-х годах, но в то время была слишком сложной и дорогостоящей. Это стало технически возможным три десятилетия спустя, когда синтез ДНК начал набирать обороты. Джордж Черч, генетик из Гарвардской медицинской школы, развил эту идею в 2011 году. С тех пор синтез и считывание данных стали экспоненциально дешевле, что, наконец, вывело технологию на рынок.

В последние годы Де Гриф и его группа занимались главным образом считыванием сохраненных данных. На данный момент это самая большая проблема, с которой сталкивается этот новый метод. Используемый в настоящее время для этого метод ПЦР, называемый "произвольным доступом", очень подвержен ошибкам. Таким образом, вы можете читать только один файл за раз, и, кроме того, качество данных слишком сильно ухудшается при каждом чтении файла. Не совсем масштабируемый.

Вот как это работает: ПЦР (полимеразная цепная реакция) создает миллионы копий нужного вам фрагмента ДНК путем добавления праймера с нужным кодом ДНК. Например, лабораторные тесты на коронавирус основаны на следующем: даже незначительное количество материала, содержащего коронавирус, из вашего носа можно обнаружить при многократном копировании. Но если вы хотите читать несколько файлов одновременно, вам нужно, чтобы несколько пар праймеров выполняли свою работу одновременно. Это создает множество ошибок в процессе копирования.

Каждая капсула содержит один файл

Вот тут-то и вступают в игру капсулы. Группа Де Грифа разработала микрокапсулу из белков и полимера, а затем закрепила по одному файлу на капсулу. Де Гриф: "Эти капсулы обладают тепловыми свойствами, которые мы можем использовать в наших интересах". При температуре выше 50 градусов Цельсия капсулы герметизируются, что позволяет проводить процесс ПЦР отдельно в каждой капсуле. Тогда не так много места для ошибок. Де Гриф называет это "термоограниченной ПЦР". В лаборатории до сих пор удавалось считывать 25 файлов одновременно без существенных ошибок.

Если затем вы снова понизите температуру, копии отделятся от капсулы, а закрепленный оригинал останется, что означает, что качество вашего исходного файла не ухудшится. Де Гриф: "В настоящее время мы теряем 0,3 процента после трех чтений, по сравнению с 35 процентами при существующем методе".

Возможность поиска с помощью флуоресценции

И это еще не все. De Greef также упростил поиск в библиотеке данных. Каждый файл снабжен флуоресцентной этикеткой, а каждая капсула имеет свой цвет. Затем устройство может распознавать цвета и отделять их друг от друга. Это возвращает нас к воображаемой роботизированной руке в начале этой истории, которая в будущем будет аккуратно выбирать нужный файл из пула капсул.

Это решает проблему считывания данных. Де Гриф: "Теперь остается только подождать, пока затраты на синтез ДНК еще больше снизятся. После этого техника будет готова к применению." В результате он надеется, что Нидерланды вскоре смогут открыть свой первый в мире центр обработки данных ДНК.

Комментарии

0 комментариев